Нови Технологии

Microsoft създава AI, който без много усилия превръща текст в реч

Computer World

Процесът на преобразуване на текст в реч става все по-точен и пълноценен, но продължава да има един основен проблем - все още се налага изкуственият интелект (AI) да бъде подлаган на дълго обучение, което коства и много ресурси, за да може той да възпроизведе естествен звук. Сега обаче, Microsoft и екип китайски изследователи обявиха, че са достигнали до значително по-ефективен метод - текстово-разговорен AI, който може да генерира реалистична реч, използвайки само 200 гласови проби с обща продължителност около 20 минути и съответните транскрипции.

 

Системата разчита частично на т.нар. “трансформатори”, дълбоки невронни мрежи, които грубо емулират невроните в човешкия мозък. Трансформаторите измерват всеки вход и изход в движение като синаптични връзки, като способстват за ефективната обработката дори на дълги последователности от символи - да речем, сложни изречения. Тази технология е комбинирана с компонент за премахване на шума, което придава оптимизирана функционалност на AI.

Очаквано, към момента резултатите не са перфектни, тъй като звукът определено е роботизиран, но за сметка на това системата е изключително точна в разбирането на думите - 99,84%. По-важното е, че тя може да направи процеса по преобразуване на текста в реч по-достъпен. Не е нужно да полагате много усилия, за да получите реалистични гласове, а това дава възможност малките компании, а дори и аматьори да търсят нови предизвикателства в сферата, от които да получат добавена стойност при своята работа. 





© Ай Си Ти Медиа ЕООД 1997-2019 съгласно Общи условия за ползване

X