15 Декабря 2009

Интерфейс мозг-компьютер: беспроводной синтезатор речи

Создан беспроводный мозговой имплантат – синтезатор речи
Мембрана по материалам Wired: Wireless Brain-to-Computer Connection Synthesizes Speech

26-летний Эрик Рамси (Erik Ramsey) парализован вот уже 10 лет и не может говорить. Теперь благодаря имплантату он научился передавать первые простые звуки. О перспективном достижении сообщила группа учёных из американской компании Neural Signals, Бостонского университета (Boston University) и ряда других институтов США.

Многие проекты в области интерфейсов «мозг-компьютер» (BCI) связаны именно с помощью парализованным. Особенно важным направлением тут является коммуникация пациента. Раньше разработчики BCI сосредотачивались на различных вариантах мысленного письма, однако такой канал слишком медленный. Гораздо привлекательнее научиться синтезировать и озвучивать речь, произносимую пациентом в мыслях.

Именно такую систему построили в США, причём в отличие от предыдущих опытов такого рода новинка является беспроводным устройством: после операции имплантат оказывается полностью спрятанным в голове пациента, никаких проводков, несущих с собой риск инфекции, наружу не выходит.

Трёхмерная томограмма головы испытуемого. Стрелкой показан провод, проникающий в твёрдую мозговую оболочку. Правее и выше виден набор электроники, установленной непосредственно на черепе, под кожей (фото Frank H. Guenther et al.). Набор контактов учёные поместили в предцентральную извилину, точнее, в участок коры, отвечающий за речь. От него проводки идут в электронную схему, расположенную на черепе. Здесь сигналы усиливаются и передаются через кожу по FM-каналу. Снаружи располагается приёмник и в нём же – катушка, осуществляющая беспроводное питание спрятанной схемы (схожий принцип подпитки чипа и передачи информации можно найти в свежем проекте сетчатки-имплантата).


Схема мозгового интерфейса – синтезатора речи (иллюстрация Frank H. Guenther et al.).

Из приёмника сигналы поступают в аналого-цифровой преобразователь и декодер, далее компьютер расшифровывает «рисунок» активности нейронов и управляет синтезатором речи.

Что важно: вся цепочка срабатывает за 50 миллисекунд, а это время, за которое у здорового человека сигнал из командной моторной коры добирается до языка и гортани, которые начинают действовать. Таким образом, ключевой особенностью опыта является обратная связь на слух – человек пытается говорить и тут же слышит звуки, на ходу корректируя свои попытки. Похоже на процесс овладение речью у малыша.

Авторы устройства проделали колоссальную работу, чтобы научиться вычленять в наборе нейронных сигналов те, что определяют конкретные форманты. Напомним, форманты – это акустические компоненты звуков, отвечающие за их характер. В случае реальной речи форманты определяются расположением и текущей формой языка. Но у парализованного пациента нарушена связь между участком коры, управляющим речевым аппаратом, и исполнительными «механизмами». Потому учёные и построили обходную схему.


Слева: томограмма мозга, вид сверху и с левой стороны.
Оранжевые пятна – активность нейронов в процессе попытки произнесения слов,
красная линия – предцентральная борозда, жёлтая – центральная борозда.
Справа: сканирование того же пациента после имплантации электродов (показаны стрелками)
(фото Frank H. Guenther et al.).

В результате, как показали тесты, постепенная практика существенно повысила точность «попадания», то есть воспроизведения парализованным человеком конкретных звуков, на выбор экспериментаторов. Детали опыта изложены в статье в PLoS ONE (Frank H. Guenther et al., A Wireless Brain-Machine Interface for Real-Time Speech Synthesis)

Правда, в нынешнем виде система обладает всего тремя проводками, подключёнными к коре в точно рассчитанных точках. Такого скромного съёма сигналов хватило на то, чтобы надёжно различать в мыслях человека гласные звуки. Так что полноценно Рамси говорить ещё не может. Но это только начало пути. Для человека, попавшего когда-то в автомобильную аварию, и эти звуки – надежда на установление речевой коммуникации.

В будущем создатели прибора намерены увеличить число контактов до 32. Тогда пациенту станет доступной вся палитра звуков.

Кроме того, пока комплекс работает лишь в лабораторных условиях, поскольку дешифровкой сигналов занимается обычный PC. Но в дальнейшем учёные намерены «утрамбовать» всё необходимое в ноутбук. Тогда испытуемый сможет со своим чипом-синтезатором разговаривать с людьми и на улице – впервые в такого рода экспериментах.

Портал «Вечная молодость» http://vechnayamolodost.ru
15.12.2009


Нашли опечатку? Выделите её и нажмите ctrl + enter Версия для печати

Статьи по теме