Технология "Глубинное обучение" (Deep Mind) может распознавать речь.
Некоторые использовали для этого такие приемы, как DCT (дискретное косинусное преобразование) и DBF (глубокое распознавание особенностей дикторской речи). В общем, раньше исследования в этой области состояли из двух направлений. Первое — с помощью CTC (нейросетевая темпоральная классификация) покадрово распознавать информацию, а потом преобразовывать ее в набор вероятностных распределений среди всех возможных фонем. Недостаток данного направления заключается в том, что слова не связывались друг с другом. Второе направление — тренировка последовательности — модели последовательностей. При этом сначала считывается отрезок последовательной информации, а потом уже производится анализ ее вероятности. Для этой же системы большую роль сыграла статья «Listen, attend and spell». В статье был выдвинут метод точного последовательного преобразования звуков в символы — модель последовательностей.
- 9 Дек, 11:57
Больше, чем Uber: технология блокчейна может сделать экономику совместного потребления реальной и стабильной
Новый документ , озаглавленный «блокчейн как главная технология для распространения равноправной рыночной экономики», написанный экономистами из Центра изучения технологии блокчейна при University College London (UCL) и из Impact Institute, бросает в...
Cегодня
В мире за неделю
-
30 Май, 13:53+5 Криптоаналитик: DOGE может вырасти до $0,322 в одном случае От Happy Coin News
-
30 Май, 09:45+6 Виталик Бутерин назвал L2-решения «культурным продолжением» Ethereum
-
29 Май, 07:46+6 Суд приговорил экс-директора FTX Райана Саламе к 7,5 годам тюрьмы
-
29 Май, 07:01+4 Суд закрыл дело против Debt Box и обязал SEC заплатить штраф $1,75 млн
-
27 Май, 21:14+5 OCP Capital: Эфир сможет рассчитывать на поддержку на уровне $3000
-
27 Май, 04:22+4 В ОАЭ пригрозили штрафами на майнинг криптовалют на фермах
-
26 Май, 05:48+5 После легализации Ethereum-ETF ожидается то же самое для SOL