Распознавание речи в Linux-системах
Автор: Janine M Lodato
Перевод: Иван Песин


Давайте посмотрим на Linux-программы распознавания речи с точки зрения Китая. Производители Linux-систем со временем начнут их производство в Китае, так как здесь обеспечивается низкая стоимость работы и большой потребительский рынок аппаратного обеспечения такого рода. Кроме того, оборудование отсюда может поставляться на другие важные рынки в мире.

Linux-компьютеры могут включать в себя системы распознавания речи, такие как IBM ViaVoice. Это особенно полезно носителям китайского языка, поскольку, как у мандаринского, так и у кантонского диалектов языка очень сложная письменная форма. Следовательно, системы распознавания речи облегчили бы создание документов. Использование клавиатуры для китайского языка практически невозможно, из-за огромного количества значащих символов.

Другие языки тоже выиграют от использования программ распознавания речи: например, повысится скорость ввода информации. Специалисты перестанут нуждаться в клавиатуре и мышке для работы с информацией. [И начнут остро нуждаться в системах звукоизоляции. :-) Представляете машино-... ээ.ээ ... -голосовой отдел, где 50 человек наговаривают текст? %-) Прим.ред.] Управляемые голосом, легко доступные телефонные системы затронут все профессии. Например водители отметят, что управление машиной с помощью голоса много удобнее традиционных методов.

Одно лишь применение систем распознавания голоса на базе Linux в сфере ухода за больными может оправдать их разработку. Услуги ухода за больными являются одними из самых дорогих в странах десятки (члены Международного валютного фонда, принявшие на себя обязательства по Общему положению о заимствовании - Прим.пер.) и, кроме того, являются одним из самых быстрорастущих рынков. Работники этой сферы получат возможность описывать процесс лечения и ухода за больными своей обычной речью. Распознавание голоса создаст автоматизированное окружение, позволяющее легко и быстро анализировать, лечить и описывать сложные случаи.

Электронное медицинское оборудование, соединенное в беспроводную локальную сеть даст возможность...

В медицине простота, надежность и низкая стоимость Linux для серверов, встроенных устройств, планшетных и настольных ПК обеспечивает ему главенствующую роль. В США только 10% документов медицинской сферы находятся в электронном виде из-за громоздкой и ненадежной природы Windows-систем. 30% средств сферы уходит на ручное создание документов, а значительное количество случаев медицинской небрежности связано с неправильным копированием небрежно записанных медицинских документов и указаний, что может подтвердить любой, кто видел выписанный рецепт.

Очевидно, что рынок для таких технологий существует. Остается найтись компании с энергичными людьми, которая захочет попасть на этот рынок. В результате распространится технология, удовлетворятся потребности многих отраслей и будет создан новый рынок, не занятый Microsoft: вспомогательные технологии (assistive technology, AT). Фактически, рынок уже существует, но должен быть расширен для включения нетрудоспособных и инвалидов.

Да, распознавание речи очень перспективно. Однако эта технология не идеальна и требует усовершенствований. Например, чтение по губам для дополнительной проверки правильности распознавания, много-тональный голосовой ввод, направленные микрофоны. Каждое поколение систем распознавания речи будет совершеннее, как и аппаратура для Linux.




Copyright (c) 2003, Janine M Lodato. Copying license http://www.linuxgazette.com/copying.html
Published in Issue 87 of Linux Gazette, February 2003


Вернуться на главную страницу