情報処理
次世代型車載向け音声信号処理ミドルウェアCABINシリーズの開発
東京都
ファーフィールドサウンド株式会社
2023年2月4日更新
プロジェクトの基本情報
プロジェクト名 | 次世代自動車ハンズフリー通話システムのための音声強調信号処理技術の研究開発 |
---|---|
基盤技術分野 | 情報処理 |
対象となる産業分野 | 環境・エネルギー、自動車、ロボット、情報通信、スマート家電、半導体 |
産業分野でのニーズ対応 | 高機能化(新たな機能の付与・追加)、高性能化(既存機能の性能向上)、高性能化(小型化・軽量化)、高性能化(信頼性・安全性向上)、高性能化(精度向上)、高性能化(高音質化)、高効率化(同じ生産量に対するリソースの削減)、高効率化(人件費削減)、高効率化(使用機器削減)、高効率化(生産性増加)、低コスト化 |
キーワード | ハンズフリー通話、インカーコミュニケーション、音声認識、マイクロホンアレー、音源分離 |
事業化状況 | 事業化に成功 |
事業実施年度 | 平成30年度~令和2年度 |
プロジェクトの詳細
事業概要
車載向け音声対話アプリケーションの課題に対応するシステムとして、次世代音声信号処理ミドルウェア「CABIN」シリーズの技術開発を行う。次世代高音質ハンズフリー通信、世界標準規格への準拠、高性能マイクロホンアレーへの対応、インカーコミュニケーションの実現、ノイズサブレッサ改良など、多くの課題を解決する新技術を開発する。
開発した技術のポイント
次世代高音質ステレオハンズフリー通話、高性能双方向インカーコミュニケーション、4ゾーンブラインド音源分離を含む高性能マイクロホンアレー、DNNベースノイズサプレッサの各技術開発に成功。ITU-Tの各種世界標準規格への準拠性を検証。
これらの成果を統合実装した音声信号処理ミドルウェア製品CABIN1~3シリーズのエンジン、及びソフトウェア開発キット(SDK)を開発。
実用化に向け、カーナビメーカー、自動車メーカーを中心に試験販売中。
具体的な成果
・次世代高音質ステレオハンズフリー通話技術の実現
5G時代のフルバンド(48kHz)ステレオハンズフリー通話を実現。
・ハンズフリー通話世界標準規格の策定と通信機器整備
ITU-T P.1120(32,48kHz), P.1140(eCall), P.1150(ICC)の標準化に貢献、それら最新規格測定装置を導入整備。
・高性能マイクロホンアレー技術の確立
サブバンド型低遅延マルチマイクブラインド音源分離技術を開発。
ビームフォーマー併用で狭小マイクモジュールでの音源分離を実現。
・インカーコミュニケーション
反響感の少ない高性能双方向インカーコミュニケーションを実現。
・DNN型ノイズサプレッサ
現行のスペクトル減産型アルゴリズムを凌駕する新技術を開発。
研究開発成果の利用シーン
CABINシリーズ製品を利用することで、自動車内で以下に示すような高性能多人数参加型音声インターフェースが実現する。
(1)5GやZoomに代表される次世代の多人数参加型高音質フルバンドステレオハンズフリー通話
(2)高性能双方向インカーコミュニケーション
(3)マイクロホンアレー技術等による同時並行型個別音声認識フロントエンド処理
特別なアーキテクチャを持つCABINエンジンは、演算量の増加を抑えつつ上記3種類の音声処理を同時並行処理可能。
ITU-Tが定める最新の国際自動車通話評価規格P.1120(スーパーワイドバンド、フルバンド通話規格)、P.1140(eCall)、P.1150(インカーコミュニケーション)に準拠。
実用化・事業化の状況
事業化状況の詳細
本研究で得られた研究開発成果は、音声信号処理ミドルウェアCABIN1, 2, 3として製品化に成功、SDKとして自動車メーカー、カーナビメーカー数社に試験導入され、それを用いたプロトタイプ開発も受託実施した。しかしながら、その後の製品化につながる受託開発案件については、国内でのコロナウイルス感染が確認された2020年2月以降、全て中断され、復活の兆しはない。
要素技術開発に成功したDNN技術は、2022年にかけてCABIN4として製品化する計画。
提携可能な製品・サービス内容
設計・製作、共同研究・共同開発、技術ライセンス、技術コンサルティング
製品・サービスのPRポイント
乗客全員が以下に示した様々な最先端の音声インターフェースを高音質利用できるよう、統合開発されたCABINミドルウェア製品が、本研究の成果である。
・フルバンドステレオの CD 並み高音質高臨場音声により、多人数話者を含む快適な通話環境を実現。
・オーディオ環境を維持したままの高性能双方向ICCを実現。
・通話、ICC、音声認識フロントエンドの異なる3機能を限られたプロセッサリソースで同時並行処理。
・マルチマイクで最大4人以上の乗員がそれら機能を同時利用可能。
・マイクロホンアレー技術で複数話者の選択的利用が可能。例えばドライバーの声のみを分離抽出することで、ドライバーのみの音声認識や通話を実現。
なお、本技術は車載市場にとどまらず、音声インターフェースを備える電話端末、PC、TV、Web会議システム、AIスピーカー、ロボット、スマートホーム等様々な製品へも応用が可能である。
今後の実用化・事業化の見通し
主力製品CABIN3は既に完成しているが、コロナの国内感染状況や、世界規模の半導体供給不足問題もあり、本製品を用いた自動車メーカー、カーナビメーカーの次世代開発の再開は依然厳しい状況にある。2021年1月に出展したオートモーティブワールド東京で、実車を使ったデモを実施、高評価だったものの、来場者は例年の1/10と振るわなかった。
一方、5G網を使い自動車内でZoomによる高音質ステレオ通話+ICCによる複数人参加型Web会議デモシステムを構築するプロジェクトが、東京都産業労働局主幹の補助事業に認定され、2022年初頭にもデモ車両が公開される。
2022年以降はこれらを有効活用しつつ各企業を個別に訪問、デモの実施をしたい。
実用化・事業化にあたっての課題
CABINは、世界でもトップレベルの性能と、最先端の次世代仕様に対応した、既に完成した製品である。それでも、カーナビメーカーがCABINのような次世代技術の導入を躊躇する背景には、増大する各種音声規格に対応するための開発リスクや膨大な開発コストを避けたい理由がある。そこで、CABIN導入の障壁を下げるべく、CABINに対応した自動プラットホーム診断・パラメーター調整システム「ADAPT」を開発中である。これにより、メーカーのCABIN導入時の新規開発、チューニングコストを大幅に抑えることが期待される。
事業化に向けた提携や連携の希望
当社技術の存在を顧客に直接届ける機会が殆どない。展示会へも出展したが、キーパーソンが展示会に参加することは極めて稀。商社と販売委託契約も交わしたが、依然接触機会は限られる。今後、自動車メーカー、カーナビメーカーに対し紹介する場を是非増やしたい。
一方、コロナ禍の緊急事態を考慮し、CABINの新たな応用先として、世界初となる双方向ハンズフリー型窓口インターホンkicoeri(キコエリ)を開発、販売した。スーパーのレジや病院の受付等、様々な所にパーティションが立てられ、かつマスク着用で会話が困難になった。その会話をkicoeriのマイク・スピーカーが補助する。これまでハウリングが生じ不可能とされていたが、CABINのICC機能で実現した。販売は好調も、更なる拡販に支援いただきたい。
プロジェクトの実施体制
主たる研究等実施機関 | ファーフィールドサウンド株式会社 |
---|---|
事業管理機関 | 国立大学法人筑波大学 猿田 正志 |
研究等実施機関 | 国立大学法人筑波大学 牧野 昭二 |
アドバイザー | 東京都立大学 アルプスアルパイン株式会社 |
参考情報
主たる研究等実施機関 企業情報
企業名 | ファーフィールドサウンド株式会社(法人番号:1012301010691) |
---|---|
事業内容 | 音声信号処理ミドルウェア、および関連機器の開発、販売、コンサルテーション。 |
社員数 | 5 名 |
本社所在地 | 〒194-0041 東京都町田市玉川学園1-22-10 玉川学園インペリアル1F |
ホームページ | https://www.farfieldsound.com/ |
連絡先窓口 | 代表取締役 石川 洋児 |
メールアドレス | ishikawa@farfieldsound.com |
電話番号 | 050-5305-2634 |
研究開発された技術を探す