News
2023.03.07
知財ニュース
スタンフォード大学、音声脳インターフェイスで「分速62語」のコミュニケーションを達成─最高記録の3倍の語数
スタンフォード大学の研究チームは2023年1月21日、病気により言語能力を失った実験志願者が、音声脳インターフェース(Speech Brain - Computer Interface :BCI)により、過去の記録の3倍の語数となる1分間に62語のコミュニケーションを達成したことを発表した。
同大学では、これまで脳インターフェースの研究を推進。脳の運動皮質に埋め込んだ鋭い電極から一度に数十のニューロン活動を記録して考えている動作パターンを受信したり、被験者に体の動きをイメージしてもらうことで画面上のカーソルや仮想キーボードを操作したりといった実験を行ってきた。
音声脳インターフェースは、4つの皮質内微小電極アレイ(うち2つは運動野、残りの2つはブローカ野)から神経活動を記録し、テキストから音声調音器へ同調することで、大量の語彙から自由な文章を伝達する技術。発話時に発される神経活動や音を解読することで、構音障害や麻痺のある人々のスムーズなコミュニケーションを促進する可能性を秘めている。
今回の研究では、ヒトの動作の中で最も複雑な動きを含むと言われる「発話」に注目し、筋萎縮性側索硬化症 (ALS)により発話が困難な被験者が話そうとした際に唇や舌をどのように動かそうとしていたかを検出。その結果、50語で従来のおよそ3分の1となる9.1%の単語エラー率を、125,000 語では23.8%の単語エラー率を達成。大語彙デコードの最初の成功例となり、本研究のBCI は毎分62語でのデコードが可能となった。これは従来の3.4倍高速であり、毎分160単語という自然な会話の速度に近づき始めている。
論文では、音声BCIに関して、皮質の小さな領域からのみ正確なデコードを可能にする音声調音器へのチューニングと、麻痺後も何年も持続する音素の詳細な調音表現の2つの側面を強調している。皮質内で発話BCIを使用することで、発話できなくなった麻痺者との迅速なコミュニケーションを回復するための実現可能な道筋を示している。
Top Image : © Stanford University