AI導入・開発はAIのミカタにお任せください お問い合わせ

OpenAI、画像内テキスト精度99%を達成 デザイン業務への活用が現実的に

OpenAI、画像内テキスト精度99%を達成 デザイン業務への活用が現実的に
  • URLをコピーしました!

2026年4月21日、OpenAIは画像生成AI「gpt-image-2」を発表し、即日提供を開始した。注目すべきは、これまでAI画像最大の弱点とされてきた「文字の崩れ」がほぼ解消されたことだ。

目次

「文字が崩れる」問題がほぼ解消、99%の精度を達成

AI画像に文字を入れると、必ずグチャグチャになる——これは、画像生成AIを触ったことがある人なら誰もが知る「あるある」だった。ロゴに社名を入れれば読めない文字列が並び、チラシのキャッチコピーは意味不明な記号になる。だから現場では「AIで絵だけ作り、文字はあとから人間が乗せる」が当たり前の手順だった。

gpt-image-2は、その前提を変えた。従来のAIは絵と文字を同時に「描いて」いたため、どこに文字を置くかを考えないまま生成が進み、結果として形が崩れていた。新モデルは画像を生成する前に「どこに何の文字を置くか」を先に考えるThinking Mode(思考モード)を搭載している。設計図を先に引いてから工事を始めるイメージだ。OpenAIの発表によると、文字レンダリングの精度は99.2%に達するという。また、AI画像の品質をユーザーが直接投票で評価するランキング「Image Arena」でも首位を獲得したと報告されている。

99%という数字が意味すること

先行テストを実施したPollo AIは、「左手の親指に緑色の指輪をはめる」という細かい指示を10回試して10回完璧に再現できたと報告した。これまでなら指輪の色がずれる、位置がおかしい、そもそも消える——そういった修正作業が必ず発生していた。それが不要になった、という評価だ。

日本語など非英語圏の文字も対応

この精度向上は日本語でも変わらない。リリース直後から導入したSHIFT AIやUravationでは、広告バナーやSNS広告クリエイティブの制作において、日本語テキストの精度が99%を超えたことで「生成後の文字打ち替え工程」をほぼゼロにできたという。日本語のロゴやキャッチコピーを含む素材が「一発生成」で最終成果物として成立する水準に達した、というのが現場からの評価だ。

広告・チラシ・パッケージ制作が最終成果物として成立

ポスター・チラシ・SNS広告が「そのまま使える」品質に

「AIで絵を出し、あとから文字を乗せる」——その二段階が一段階になった。生成した画像がそのまま納品物になる。

この変化は日本語テキストの扱いだけに限らない。価格、イベントの日付、複数の商品名が並ぶチラシ——「間違えたら事故になる情報」をAIに任せることは、従来は難しかった。それが修正なしで出力できる水準になったという。

1回の指示から、同一ブランドカラーを維持した画像を最大8枚同時生成する機能も加わった。SNS広告で縦長・横長など複数フォーマットを揃える作業が、一度の操作で完結する。

商品パッケージとUIモックアップにも実用レベル

商品パッケージへの応用も現実的になっている。曲面に載る細かい文字、多言語で書かれた成分表示ラベルも正確にシミュレーションできる水準だ。アプリやWebサービスの画面設計を確認するためのUIモックアップにも活用されており、テキストが正確に表示されることで、デザインの確認サイクルが短縮されている。画質は雑誌の見開きや大型ポスターに耐える水準で、印刷物への応用も現実的な選択肢に入った。

料金体系と提供範囲——APIとChatGPTの両経路で提供

ChatGPTのPlus・Pro・Businessプランに加入していれば、追加費用なしで今すぐ全機能を使える。思考モードも含まれる。無料ユーザーでも基本的な画像生成は試せる。まず無料で触れてみて、業務での活用を検討するなら有料プランへ——というのが現実的な使い始め方だ。

企業や開発者がシステムに組み込む場合は、API名「gpt-image-2」で即日提供されている。料金は画像1枚あたり数円〜数十円が目安で、画像サイズや解像度によって変動する。

すでに300万人以上が利用しており、毎日400万枚以上の画像が生成されている。旧モデルは非推奨となり、今後はgpt-image-2に一本化される方向だ。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

目次