SecureMemo | オフライン音声文字起こし・議事録AI
SecureMemoはセキュアなオフライン・オンプレミス環境で高精度なAI音声文字起こし・議事録作成を実現。話者分離・自動要約にも対応。
https://info.nishika.com/solution-cl/transcribe
Nishikaという会社を経営しております松田と申します。
本稿は、NishikaがAIプロダクトSecureMemo/SecureMemoCloudで実現しようとしている世界観をまとめたものです。
の両方に、本稿の考えが届けば、と思って書いています。
突然ですが、「会議」と聞くとどんな印象を持たれるでしょうか。
多くの人にとっては、あまり良い印象の言葉ではないかもしれません。
会議にまつわる問題点は枚挙にいとまがありません。仮に会議の改善点について語る会議が行われたら、いつまでも白熱して終わらないことでしょう。
しかし、当然ながら必要性があるから、会議はあらゆる企業で日々行われているわけです。
会議の意義、そんなの当たり前じゃないかと誰もが思われるでしょうが、何事も言語化は大切。再確認しておきます。
私見では、以下の意義が大きいと感じています。
情報を共有して、何をやるか決めて、やっている中でぶつかった問題をみんなで解決して、それら全てが円滑に進むようなチームアップをしていくための場が会議である。
と書くと、これはまさに事業運営そのもので、会議は言わば「事業のエンジン」というべき場、駆動装置であり、これがなくては会社は動きません。
(会議全くなしでチャットコミュニケーションだけでプロダクトが出来上がり、それがユーザーの支持を受けて事業が大きくなっていくケースもごく一部あります。これはこれで素晴らしいと思います。)
それだけ重要な会議ですが、一方で会議は開催することに力が注がれ、その会議が何を生み出したか、は軽視される場合があります。
私は社会人人生をコンサルティング会社でスタートしたので、決定事項とToDoを明文化しない会議はあり得ない、という文化で育ちましたが、聞くところによればそれすら曖昧なまま終了していく会議も多くあるそうです。
そこまでひどくなくとも、決まったことはさすがに明文化されているけど、どういう議論を経て決まったかは誰も記録に残してない、ということは結構あるのではないでしょうか。
かくいう私も、物忘れが激しく「どうしてこういう結論になったんだっけ?」と部下に聞いてしまうことがよくあり、日々迷惑をかけています・・・
ここで、AIを使えばどうなるか。
想像してみてください。
会議をしていたら、
会議の後には、
どうでしょうか。
仕事の効率も上がるし、言った言わないの無駄なやりとりもなくなるし、より充実した情報をもとに意思決定ができる。
より良い仕事ができる感じがしませんか。
SecureMemo/SecureMemoCloudは、そんな企業の体験を実現します。
SecureMemo/SecureMemoCloudは、世界最高水準の精度を誇る音声認識AIを搭載した、会議録作成をサポートするプロダクトです。
文字起こしは我々の目指す世界観の第一歩・一丁目一番地ですが、数年前までは文字起こしの精度がそもそも十分でなく、導入を断念せざるを得なかった、というお話をお客様からよく聞きます。
しかし、弊社プロダクトが実現する文字起こしの水準は、読んで意味の分かる、手直しすべき箇所が非常に少ないものとなっており、実用水準に達しています。
SecureMemoリリースからまもなく1年が経ちますが、警察・医療機関・学術機関・民間企業IR部門など、多くの業種のお客様に導入いただけているのがその証左です。
また、音声認識の精度が実用レベルに達した今、実用の現場を考えると「今後重要なのは音声認識の精度を上げることではない」という観点があります。発された音声に忠実に文字起こしされた結果が欲しいのではなく、適度に補正された読みやすい結果が欲しいという人がほとんどです。余計なフィラーは除かれていて、適度に句読点が入っていて読みやすく、言い淀み・言い直しがうまくまとめられたものが欲されています。
Nishikaは、高い認識精度を最終ゴールとするのではなく、「ユーザーにとって最も心地良い音声認識結果を提示すること」をゴールに置いたAI開発を進めています。
さらに、SecureMemoは処理がオンプレミス環境で完結し、機微な情報が話されることが多い会議録のデータ化に適しています。
SecureMemoCloudは、GPU環境を利用した高速な文字起こし・最先端の生成AIによる高精度な要約を実現します。
オンプレミス環境で動作する個人情報抽出のAIモデルを併用することで、「オンプレ/クラウドのいいとこどり」も可能。要約前に個人情報をマスキングし、要約後にオリジナルの情報を差し戻す「De-identification, Re-identification」で、最先端の生成AIを利用しつつ、セキュリティの担保を両立することも可能です。
人の営みには必ずと言って良いほど発声が含まれるので、活用シーンは会議だけではありません。
企業活動でいえば商談、採用の場面でも使えますし、コールセンターの応答記録、医療機関の診断、学校の教育、自治体の住民とのやりとりでも使えます。
一説によれば、人は1日に1000-5000語くらい書き(参照)、1日に7000-20000語くらい話すそうです(参照)。テキストデータだけでなく音声データも蓄積されていく世界では、ただでさえ指数関数的に増えていると言われるデータ量が、さらに数倍から数十倍に非連続に増える可能性があります。
データ量だけの話ではなく、書き残すのはちょっと憚られるけど喋るのは気が楽という側面があるので、貯まるデータの質も変わっていくでしょう。
そして、大量に蓄積された新たなデータによって、既に驚きを提供してくれている生成AIが、さらに精度を高め、利用シーンが広がることが予想されます。
高精度の音声認識AIと生成AIを使って、企業の会議を全てデータ化し会議から新たな価値を引き出す。
そんな未来を実現するために、技術力に自信のあるメンバーが揃って取り組んでいるのがNishikaです。
Nishikaは「テクノロジーですべての人が誇りを持てる社会を」をビジョンに掲げ、遍くビジネスパーソンにとってテクノロジーが身近な存在となる世界を目指して創業しました。
Nishikaの祖業は、「データ分析コンペ」という、AIの技術者同士がAIの精度を競い合い最も高い精度のAIをクライアントに納める、AI開発事業でした(世界的には「Kaggle」で著名。こちらなど参照)。
現在は、弊社のビジョンを達成するにはAI開発にとどまるのではなく、アプリケーションの提供までしなければユーザーの体験を真に変えたことにならないと考え、SecureMemo/SecureMemoCloud事業を展開するに至っています。
しかし、データ分析コンペで成果を出せる手法・能力は、良いAIプロダクトの開発においても有用です。実は弊社で活躍する技術者の多くは弊社開催のコンペ入賞者でもあり、コンペで培った・示した力を名実ともにプロダクト開発に活かしています。
そんなNishikaが提供するプロダクト・実現する世界観に是非ご期待ください。また、本noteの世界観に興味が出たという方、お気軽に意見交換もさせていただけると大変嬉しく思います(こちらからご連絡ください)。
Nishika代表取締役 松田裕之
本noteの他に、Nishikaのことをもう少し知っていただける情報を掲載しています。
Nishika 企業HP
Nishika 求人一覧