mocoVoice医療モデルでカルテ入力はどこまで楽になるか｜10万語対応・オンプレミス運用を徹底解説

2026年5月28日

URLをコピーしました！

診察が終わった後、パソコンに向かってカルテを打ち続ける時間——医療従事者なら誰しも心当たりがあるはずです。「記録のために医療をしているわけじゃない」。そんな現場の声に応える形で登場したのが、音声だけでカルテの下書きを作れるAIサービス「mocoVoice 医療モデル」です。

この記事では、mocoVoice医療モデルが実際にカルテ入力をどこまで楽にしてくれるのか、機能・コスト・セキュリティの面から掘り下げます。新しい製品だからこその期待とリスク、両方を正直にお伝えします。

mocoVoice医療モデルとは

カルテ入力の負担はどれくらいか

外来が終わっても、医師の仕事は終わりません。
患者さんとの会話を思い出しながら、所見や処方内容をカルテに入力していく——この記録作業が、診察そのものより長くかかる日もあります。「午前の外来が終わったのに、カルテが終わるのは昼過ぎ」という話は珍しくありません。

スマホの音声入力で済むなら、とっくにみんなやっています。
試しにSiriやGoogleの音声入力で「右上肺野に浸潤影を認める」と話してみてください。おそらく「見ぎ上は胃やに進入影を認める」のような、まったく使えないテキストが返ってきます。一般向けの音声認識は、医療用語をほとんど知らないのです。

この「医療の言葉が通じない」という根本的な問題を解決するために作られたのが、mocoVoice 医療モデルです。
mocomoco株式会社が2026年3月にリリースした医療現場特化のAI音声認識サービスで、10万語以上の医療用語データベースで追加学習済み。「右上肺野」「浸潤影」といった専門用語や略語も、そのまま正確にテキストへ変換してくれます。

mocoVoice医療モデルは10万語以上の医療用語を学習済みで正確に変換できる

一般的な音声入力は医療用語をほぼ認識できない

つまり「話すだけでカルテの下書きができる音声入力」。これがmocoVoice医療モデルの一言での説明です。

ただし、ここで注意しておきたい点があります。mocoVoiceに関する情報源は、現時点ではmocomoco社の公式サイトとプレスリリースに限られています。独立した第三者機関のレビューや、学会での評価報告などは見つかっていません。
この記事もmocomoco社が公開している情報をベースに書いていますので、その前提で読んでいただければと思います。

診療記録からカンファレンスまでの使い方

メインの使い方は、診察後のカルテ入力です。
診察が終わったらマイクに向かって所見や方針を口述するだけ。音声がそのままテキスト化され、SOAP形式（Subjective：主観的情報、Objective：客観的情報、Assessment：評価、Plan：計画）に要約する機能もあります。キーボードで打つより話すほうが速い分、入力作業自体の時間は短くなるはずです。
ただし、具体的に「何分が何分に短縮できる」という公開データは、現時点では存在しません。実際の時短効果は、診療科の用語の複雑さや話し方のクセ、変換後の修正量によって大きく変わります。

時短効果はトライアルで自院の実測値を確かめる

mocoVoiceによる時間削減効果の公式データは未公開です。「半分になる」等の期待値で導入を決めず、トライアルで自院の実測値を確かめるのが確実です。

STEP

診察終了

患者との外来診察を終える。

STEP

マイクに口述

所見や診療方針をマイクに向かって話す。

STEP

テキスト変換

音声がそのままテキスト化される。

STEP

SOAP要約

テキストがSOAP形式（主観的情報・客観的情報・評価・計画）に自動要約される。

STEP

カルテ下書き完成

要約されたテキストがカルテの下書きとして完成。医師が確認・手直しして完了。

もうひとつ注目したいのが、カンファレンス（診療チームの打ち合わせ）での活用です。
複数の医師が参加する症例検討会を録音しておき、後からまとめて文字起こしできます。最大12人の話者を識別する機能があるので、「誰が何を言ったか」も区別して記録に残せます。議事録づくりに毎回時間をかけていた、という現場には地味に効く機能です。

[図解] 「外来カルテ入力」「カンファレンス議事録」「回診メモ」の3つの利用シーンを、中央のmocoVoiceアイコンから矢印で放射状に示すシンプルなフロー図

ただし、ここで大事なのは期待値の調整です。
音声入力はあくまで「下書き」を作るもの。最終的には医師自身が内容を確認し、必要に応じて手直しする前提です。手直しが少なければ少ないほど実用的——この「修正の手間がどれくらいか」が、導入後の満足度を左右する分かれ目になります。

10万語の医療用語を聞き分ける実力

前のセクションで「手直しの少なさが実用性の分かれ目」と書きました。
では、mocoVoice医療モデルはなぜ手直しを減らせるのか。カギは「医療の辞書を丸ごと覚えたAI」という設計にあります。

一般的な音声入力が医療用語でつまずく理由はシンプルで、そもそも知らない言葉は正しく変換しようがないからです。たとえば「アセトアミノフェン」と話しかけても、「アセトアミノ変」のようなとんちんかんな変換が返ってくる。「COPD」と言えば「コピーディー」、「HbA1c」に至っては完全にお手上げです。

mocoVoice医療モデルは、JMED-DICT miniという医学概念データベースを使って追加学習（ファインチューニング＝AIに特定分野の言葉を集中的に覚えさせる訓練）を済ませています。収録語数は10万語以上。薬品名、病名、検査略語、解剖学用語——カルテに登場する言葉をひと通りカバーしています。

10万語以上の医療用語を追加学習済みだから、「右上肺野」「COPD」「HbA1c」「アセトアミノフェン」のような専門用語や略語もそのまま正しくテキスト化できる

これが実務で何を意味するかというと、音声入力した後にキーボードで直す回数が減ります。
音声入力の便利さは「話す速さ」ではなく「直す少なさ」で決まります。どれだけ速く入力できても、変換ミスを1つずつ直していたら結局キーボードのほうが早い。認識精度が高いからこそ、音声入力が本当の時短になるわけです。

認識精度の数値は現時点で非公開——トライアルで自院の用語を確かめよう

ただし正直に書いておくと、認識精度の具体的な数値（正答率○%など）は現時点では公開されていません。10万語の辞書を持っているという事実と、実際の現場でどこまで正確に聞き取れるかは別の話です。この点は、後述する導入ステップの中でトライアルを使って確かめるのが確実です。

オンプレミス対応で患者データを守る

精度がいいのはわかった。でも「患者の音声データって、外に漏れないの？」——ここが気になる方は多いはずです。

クラウド型の音声認識サービスでは、話した内容がインターネットを通じて外部のサーバーに送られます。つまり、患者さんの診療情報が病院の外を流れるということ。個人情報保護の観点から、これに抵抗を感じる医療機関は少なくありません。

オンプレミス型：院内サーバーだけで処理が完結し、データが外に出ない

クラウド型：音声データがインターネット経由で院外サーバーへ送信される

mocoVoice医療モデルは、オンプレミス——つまり院内のサーバーだけで処理が完結する方式に対応しています。患者さんの声も、変換されたテキストも、病院の建物から一歩も出ません。「セキュリティが心配で音声入力を見送っていた」という病院にとっては、検討のテーブルに乗せられる条件がひとつクリアになります。

オンプレミス対応により、患者データを院外に出さずに音声認識が使える。セキュリティを理由に導入を見送っていた医療機関にとって、検討の入口になる。

導入前に確認したいポイント

精度もセキュリティもクリアできそうだとわかったら、次は「じゃあ実際、うちの病院で使えるの？」という話です。
ここでは、比較検討で必ず出てくるAmiVoiceとの違いと、導入前に押さえておきたい実務面のチェック項目を整理します。

AmiVoiceとの違い

医療向けの音声認識と聞いて、真っ先に思い浮かぶのがAmiVoice（アミボイス）でしょう。
株式会社アドバンスト・メディアが長年提供してきた医療音声認識の老舗で、全国の大学病院から中小クリニックまで幅広い導入実績があります。富士通・NEC・PHCといった主要電子カルテベンダーとの連携実績があり、多くの現場で「電子カルテを入れたらAmiVoiceもセットで入っていた」という形で定着しています。
医療現場での「枯れた安心感」——動作が安定していて、サポート体制も整っている、という信頼が最大の武器です。

一方のmocoVoice医療モデルは、2026年3月にリリースされたばかりの新興製品です。
導入実績はまだ少ない。ただし、その分だけ身軽さがあります。

比較軸	AmiVoice	mocoVoice医療モデル
実績	大学病院〜クリニックまで多数の導入実績。医療音声認識の事実上の標準	2026年3月リリース。実績はこれから
導入形態	クラウド型・オンプレミス型いずれも対応	オンプレミス対応。院内完結で運用可能
電子カルテ連携	富士通・NEC・PHCなど主要ベンダーとの動作検証・連携実績あり	API設計を前提としており、既存システムへの組み込みがしやすい設計。ただし各社カルテとの連携実績は未公開
対応語数	医療辞書搭載（詳細非公開。長年のアップデートで診療科別の語彙を蓄積）	10万語以上の医療用語を追加学習済み
サポート体制	専任サポート窓口あり。導入支援・トレーニングメニューが整備されている	要問い合わせ。サポート体制の詳細は未公開
費用	要問い合わせ（買い切り型・サブスク型などプランあり）	要問い合わせ

どちらが優れているかではなく、「枯れた安心感」と「新しい柔軟さ」のどちらを重視するかで選び方が変わります。
実績と安定性を最優先にするならAmiVoice、APIで自院のシステムに柔軟に組み込みたいならmocoVoiceが選択肢に入る——そういう棲み分けです。

mocoVoice：乗り換えより「部分導入で試す」が現実的

mocoVoiceは新興製品のため、長期運用の実績やサポート品質は未知数です。AmiVoiceからの完全乗り換えではなく、まず併用や部分導入でリスクを限定しながら試すほうが賢明です。

正直に言えば、現時点でmocoVoiceはAmiVoiceの「対抗馬」というより「新しい選択肢」です。
導入事例の蓄積や、実際に何年も安定稼働するかどうかは、これからの話。新しい製品に飛びつくリスクは理解したうえで、自院との相性を試す——その姿勢が大事です。

どんな医療機関に向いているか

mocoVoice医療モデルは、すべての医療機関に等しくフィットするわけではありません。
製品の特徴から考えると、相性がよさそうな医療機関にはいくつかの共通点があります。

mocoVoiceが向いている医療機関の条件

外来件数が多い
API対応の電子カルテを使っている
IT担当者がいる（オンプレミスの場合）
新しいツールを試す風土がある

外来件数が多く、カルテ入力が慢性的なボトルネックになっている病院が、もっとも恩恵を感じやすいでしょう。1日50件、100件と外来をこなすような内科・整形外科・耳鼻科などでは、たとえ1件あたり数分の短縮でも、積み上げれば大きな差になります。

APIに対応した電子カルテを使っていることも重要な前提条件です。mocoVoiceの音声認識結果をカルテに自動で流し込めるかどうかは、受け手側のカルテの仕様次第。ここが噛み合わないと、結局コピー＆ペーストの手作業が残り、時短効果が半減します。

オンプレミス導入を選ぶ場合は、IT担当者の存在が事実上の必須条件です。 サーバーの設置・ネットワーク設定・日常的な保守運用を担える人がいないと、導入後に立ち行かなくなるリスクがあります。IT専任スタッフがいない小規模クリニックの場合は、クラウド型で利用できるかどうかをmocomoco社に確認するのが現実的です。

逆に向いていないのは、「いま使っている電子カルテがAPIに対応していない」「ITに詳しいスタッフがいない」「そもそもカルテ入力量が少ない」というケースです。無理に導入しても、コストに見合わない可能性があります。

費用感と導入の進め方

費用感については、正直なところ公開情報がほとんどありません。
AmiVoiceも含め、医療向け音声認識は「要問い合わせ」が業界の標準で、病院の規模や利用範囲によって見積もりが変わるのが一般的です。導入事例やサポート体制の詳細も、現時点ではmocomoco株式会社に直接確認するのが確実です。

もうひとつ知っておきたいのが、カスタマイズ可能な辞書機能です。自院固有の略語や院内用語も追加登録できるので、「うちの科ではこう言う」という独自の表現が多い現場ほど、使い込むほどに精度が上がっていく仕組みになっています。

STEP

mocomoco社に資料請求・問い合わせ

費用・サポート体制・トライアルの有無を確認する。公開情報が少ないため、直接問い合わせが最初の一手です。

STEP

自院の電子カルテのAPI対応状況を確認

mocoVoiceの認識結果をカルテに自動入力できるかは、カルテ側の仕様次第。カルテベンダーに確認します。

STEP

トライアルで自診療科の用語が通るかテスト

カタログスペックではわからない「うちの現場との相性」を確かめる。よく使う用語が正確に認識されるかが判断の核心です。

STEP

費用・サポート体制を比較検討

AmiVoiceなど他製品との見積もりを並べ、長期運用コストとサポート品質も含めて判断します。

結局のところ、新しい製品だからこそ「まず手を動かして確かめる」が最も確実な判断方法です。
トライアルや資料請求で、自院の診療科でよく使う用語がちゃんと通るか、電子カルテとの連携に問題がないかを実際に試してみてください。カタログスペックだけでは見えない「うちの現場に合うかどうか」は、使ってみないとわかりません。

よかったらシェアしてね！