ギグワークスクロスアイティが開発!
デコール音声認識エンジンとは?

コロナの流行で新しい生活様式にシフトしつつあるなか、様々な場所でAI技術を目にするようになってきました。中でも、音声認識システムは目覚ましい発展を遂げています。この音声認識システムを使用したスマートスピーカーは人々の生活に浸透してきましたが、この技術はビジネスの場面でも様々に役立っています。たとえばコールセンターや作業現場などですでに導入されており、業務効率化や時間短縮に大いに貢献しているのが実情です。

このように、一度はどこかで体験したことがあるであろう音声認識の技術ですが、ギグワークスクロスアイティが開発したデコール音声認識エンジンとはどういったものでしょうか。

音声認識の基本的な仕組みとともに、デコール音声認識エンジンの現状と課題、そして今後どのようになっていくのかを見ていきましょう。

音声認識とは?

音声認識とは、人が話した言葉を文字テキストとしてコンピュータに認識させる技術のことです。多くの人が使用しているスマートフォンに話しかけて操作をすることや、昨今世の中で流行しているスマートスピーカーなどもこの技術が使用されています。これらは個人用途としての使用例ですが、コールセンターなどビジネス用途としての活用も見られます。

【関連記事】「コール業務を効率化!ギグワークスクロスアイティの音声認識と分析技術」

音声認識の仕組み

人が話した言葉を文字テキストに起こすには、いくつかのステップを踏みます。

まず初めに、音響分析で入力された音を音の周波数や強弱などの条件を基にコンピュータが認識しやすいデータに変換します。次のステップは音響分析で、変換されたデータを学習したパターンと照合し、音声を正しい文字に当てはめることです。

文字となった音は発音辞書で音声の最小単位ごとにモデル化されているデータベースの中から単語として認識させられ、さらに、言語モデルで予め蓄積した膨大な量のデータから、より正確な文章を組み立てていき、文字テキストが出来上がります。

個人用途だけではない!音声認識技術を用いたサービス

個人がスマート家電を利用して快適な暮らしを手に入れられるようになるとともに、ビジネス用途として音声認識技術を利用している企業も多数あります。

主なビジネス用途としては、コールセンターでの利用、議事録や文字起こし、介護現場や作業現場での報告書作成などです。また、車の試乗の際に同乗していた営業マンの代わりを車に搭載されたAIが務めるという事例もあります。

ギグワークスクロスアイティが開発した「デコール音声認識エンジン」

ギグワークスクロスアイティは、デコール音声認識エンジンを開発しました。この音声認識エンジンは、デコールCC.CRM3と連携し、コールセンターの応対時に自動で音声録音と対話ログの作成を行います。デコールCC.CRM3と合わせて、デコール音声認識エンジンについて見ていきましょう。

デコールCC.CRM 3 _ ギグワークスクロスアイティ株式会社

デコールCC.CRM3とは

デコールCC.CRM3は豊富な導入実績とお客様の声を基に構築された、コールセンター業務向けCRMシステムのことです。センター業務の効率化や品質の向上、マルチテナント対応でトータルコストの削減も図れ、導入後のサポートも万全なため、この20年で250社7000席以上の導入実績を誇っています。

デコール音声認識エンジン

ギグワークスクロスアイティは、日本語に対応した自動要約技術の開発を進めてきました。また、コール業務に特化した音声認識エンジンの開発も進めており、これらを合わせるとコールセンターの応対時に自動で音声録音と対話ログの作成が可能です。記録された対話ログはAIによるテキストマイニング等に活用することができ、業務効率化だけでなくコール業務の品質向上を狙えるのは間違いないでしょう。

音声認識の進むべき未来に向けての課題とは?

音声の認識精度が高ければ高いほど、正確な文字となって表れます。音声からテキストへ変換するためのプロセスでその行為を阻害する事象がある場合は認識精度が下がるため、出来上がったテキストは精度の低いものになってしまいます。

音声認識に欠かせない条件

方言や若者言葉、スラングなどを使用すると、発音辞書でのマッチングが困難になるため、正しい言葉を導き出せません。また、雑音やノイズの少ない静かな環境であることも重要です。これは、少人数の会話のほうが正確な音声を認識しやすいことにも繋がります。

人間同士の会話であれば、文脈や相手の表情から聞き取れなかった言葉も想像できますが、音声認識システムが人間と同等のレベルになるためには、人工知能と機械学習の発展が要となるでしょう。

前後の言葉や文脈を意識した音声認識

現在の音声認識は、一つひとつの音をコンピュータに読み込ませるためのデータとして認識し、それを単語化し、膨大な量の言語モデルから文章を作成しています。しかし、人間同士の会話では前後の言葉や文脈を意識してなされているため、一文ごとにテキスト化している現状の音声認識では文章にした際、違和感を感じることもないとは言い切れません。

今後は、前後の文脈を意識した音声認識の開発が必要不可欠となるでしょう。

ギグワークスクロスアイティの音声認識エンジンで開ける未来

ギグワークスクロスアイティでは今後、音声とテキストによる感情分析や対話ログの自動要約へと活用の幅を広げていく予定です。現在の音声認識からできる感情の推定と、リモート接客の状況を見ていきましょう。

音声認識エンジンで感情の推定

ギグワークスクロスアイティが開発した音声認識エンジンでは、認識した音声をテキストにするだけでなく、認識結果からピックアップされた単語をもとに感情を推定することができます。単語の分類属性からポジティブかネガティブかを判断できるので、個人差が出ないのが大きなメリットと言えるでしょう。その一方で、使用単語が中立的なものであると感情の判断が難しい場合があるのも事実です。

音声認識エンジン×リモート接客

音声認識エンジンは、リモート接客の場面でも活用できます。抽出した文字や話し方からある程度の感情を読み取ることができるため、離れていても顧客の感情が読み取れ、顧客に寄り添った提案をすることが可能になります。また、応対ログの作成により、顧客との接客状況のデータ分析はもちろんのこと、接客に慣れていない新人の教育もスムーズにできるでしょう。これらのデータをもとにマーケティングの幅を広げられる可能性があることを考えると、音声認識エンジンは幅広い活用方法を秘めていると言えます。

デコールCC.CRM3×音声認識エンジンで開ける未来

コールセンターのDXを推進しよう

20年の実績を誇るデコールCC.CRM3は、コールセンター業務に必要な多くの機能を装備しています。ギグワークスクロスアイティは、そのデコールCC.CRM3に新しく音声認識エンジンを連携し、コールセンターの応対時に自動で音声録音と対話ログの作成を行えるようにしました。それにより、コールセンター業務の効率化が図れることは間違いありません。

また、コールセンター業務以外にも音声認識エンジンの活路を拡大しており、リモート接客にもその技術は使われるようになりました。今後は感情の読み取りや、要約機能をより充実させることで益々活用の幅が広がっていくでしょう。

この記事を書いた人

ギグワークスクロスアイティ編集部