パソコンやスマートフォン(高機能携帯電話=スマホ)に話しかけると操作や文章入力ができる音声認識技術の普及が急ピッチだ。米アップルやNTTドコモがスマホで採用したほか、シャープの掃除機など音声で操作できる家電も続々登場している。蓄積した大量データを容易に参照できるクラウド技術が認識精度を高め「技術者の夢」を実現に導いた。「週末京都は晴れるかな」「はい晴れるでしょう」――。スマホに質問すると音声で
NHK総合テレビで平日午後4時から放送されているニュースで、本日より字幕放送がスタート。この字幕は、NHK技研の音声認識をベースにして開発された制作システムによってリアルタイム生成されているという。 この字幕制作システムは、2010年にNHK技研が研究発表していたもの(関連リンク)をベースに開発されたものという。 アナウンサーのように喋り方の訓練を受けていない一般の方のしゃべりについては、リアルタイムで字幕生成しづらいという。たとえば一般の方へのインタビューなどの場合は、制作側が喋り直し(リスピーク)して、リアルタイム字幕生成を行うとのこと。 NHKは今後も、字幕放送に対応した番組を順次拡大していく考えだ。
名古屋工業大学の開発した『MMDAgent』が最新デジタル製品の展示会『CEATEC JAPAN 2010』に展示され、話題だ。『MMMDAgent』は3Dのキャラクターとおしゃべりすることができるソフトだ。こちらが話しかけると、初音ミクなどのキャラクターがアニメーションつきで返答してくれる。例えば「明日の天気は?」と聞けば「名古屋の天気は晴れです」と答えたり、「歌ってよ」といえばその歌声を披露してくれる。巨大なディスプレイに表示すれば、まるで2次元がこちらにきてくれたような感覚が味わえる。 このソフトの画期的な点は、簡単な記述で誰でもシナリオが書けることだ。たとえば「そんな装備で大丈夫か?」という声が聞こえたら「大丈夫だ、問題ない」と動作をつけながら返答する…というプログラムがたったの2行で書けてしまう。しかも動作させるキャラクターは簡単に入れ替え可能。キャラクターの3Dモデルとして普及
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く