شرکت xAI در تازهترین بهروزرسانی خود اعلام کرده که کاربران اکنون میتوانند تنها با چند جمله گفتار طبیعی، یک مدل صوتی اختصاصی بسازند و آن را در تمام سرویسهای صوتی Grok به کار بگیرند. این قابلیت که با نام Custom Voices معرفی شده، امکان تولید صداهای شخصیسازیشده را برای کاربردهای مختلف فراهم میکند؛ از تولید محتوا گرفته تا پشتیبانی مشتریان و حتی کمک به افرادی که توان تکلم خود را از دست دادهاند.
این ویژگی همراه با یک Voice Library جدید عرضه شده که مدیریت صداهای سفارشی و پیشفرض را در یک محیط واحد سادهتر میکند.
ساخت صدای اختصاصی در کمتر از دو دقیقه
xAI اعلام کرده که فرآیند ساخت یک مدل صوتی شخصی بسیار سریع و ساده است. کاربر کافی است حدود یک دقیقه متن کوتاه را با صدای خود بخواند. سیستم ابتدا یک عبارت امنیتی را بررسی میکند تا مطمئن شود صدا متعلق به خود کاربر است. سپس با تحلیل ویژگیهای صوتی، یک مدل اختصاصی تولید میشود که بلافاصله در سرویسهای Text‑to‑Speech و Voice Agent API قابل استفاده است.
این مدلها میتوانند در پروژههای مختلف بهکار گرفته شوند و کیفیت خروجی آنها مشابه صدای واقعی کاربر است.
کاربردهای گسترده Custom Voices
xAI چندین سناریوی مهم برای استفاده از این قابلیت معرفی کرده است. از جمله:
– تولید محتوای صوتی برای شبکههای اجتماعی، ویدئوها و پادکستها بدون نیاز به ضبطهای مکرر
– ایجاد صدای ثابت و برندمحور برای تیمهای پشتیبانی و ارتباط با مشتری
– کمک به افرادی که به دلیل بیماری یا حادثه توانایی صحبتکردن را از دست دادهاند
– تولید نسخههای چندزبانه از سخنرانیها یا پیامهای مدیران
– استفاده در بازیها، انیمیشنها و پروژههای سرگرمی برای ساخت شخصیتهای صوتی
– تبدیل متن به کتاب صوتی با صدای خود کاربر
این قابلیت میتواند روند تولید محتوا را برای بسیاری از کسبوکارها و تولیدکنندگان مستقل سادهتر و سریعتر کند.
تأکید بر امنیت و جلوگیری از سوءاستفاده
xAI اعلام کرده که سیستم ساخت صدای سفارشی بهگونهای طراحی شده که قابل فریب نیست.
این یعنی:
– نمیتوان از فایلهای صوتی آماده یا صدای فرد دیگر برای ساخت مدل استفاده کرد
– سیستم با مقایسه ویژگیهای صوتی و عبارت امنیتی، هویت گوینده را تأیید میکند
– ساخت مدل تنها زمانی ممکن است که کاربر واقعاً با صدای خود متن را بخواند
این رویکرد برای جلوگیری از سوءاستفادههایی مانند جعل صدا یا Deepfake طراحی شده است.
Voice Library؛ مدیریت ساده تمام صداها
همزمان با معرفی Custom Voices، xAI یک بخش جدید به کنسول خود اضافه کرده است. در این بخش:
– تمام صداهای سفارشی و پیشفرض نمایش داده میشوند
– امکان پیشنمایش، حذف، و انتخاب صدا وجود دارد
– بیش از ۸۰ صدای آماده در ۲۸ زبان مختلف ارائه شده
این کتابخانه صوتی به کاربران اجازه میدهد پروژههای صوتی خود را با نظم و سرعت بیشتری مدیریت کنند.
بدون هزینه اضافی
xAI اعلام کرده که استفاده از صداهای سفارشی در سرویسهای Text‑to‑Speech و Voice Agent API هیچ هزینه اضافهای برای کاربران ندارد. این موضوع باعث میشود قابلیت جدید برای توسعهدهندگان، تولیدکنندگان محتوا و کسبوکارها بسیار مقرونبهصرفه باشد.
جمعبندی
قابلیت جدید xAI در زمینه ساخت صدای سفارشی، گامی مهم در توسعه فناوریهای صوتی مبتنی بر هوش مصنوعی است. این ویژگی نهتنها تولید محتوا را سادهتر میکند، بلکه امکان ایجاد تجربههای شخصیسازیشده و حرفهای را برای کاربران فراهم میسازد. با توجه به سرعت بالا، امنیت مناسب و عدم نیاز به تجهیزات حرفهای، انتظار میرود Custom Voices به یکی از ابزارهای محبوب در حوزه تولید محتوا و ارتباطات دیجیتال تبدیل شود.
انتهای خبر از دایان پرو



