OpenAI、画像内テキスト精度99%を達成　デザイン業務への活用が現実的に

2026年4月23日

URLをコピーしました！

2026年4月21日、OpenAIは画像生成AI「gpt-image-2」を発表し、即日提供を開始した。注目すべきは、これまでAI画像最大の弱点とされてきた「文字の崩れ」がほぼ解消されたことだ。

「文字が崩れる」問題がほぼ解消、99%の精度を達成

AI画像に文字を入れると、必ずグチャグチャになる——これは、画像生成AIを触ったことがある人なら誰もが知る「あるある」だった。ロゴに社名を入れれば読めない文字列が並び、チラシのキャッチコピーは意味不明な記号になる。だから現場では「AIで絵だけ作り、文字はあとから人間が乗せる」が当たり前の手順だった。

gpt-image-2は、その前提を変えた。従来のAIは絵と文字を同時に「描いて」いたため、どこに文字を置くかを考えないまま生成が進み、結果として形が崩れていた。新モデルは画像を生成する前に「どこに何の文字を置くか」を先に考えるThinking Mode（思考モード）を搭載している。設計図を先に引いてから工事を始めるイメージだ。OpenAIの発表によると、文字レンダリングの精度は99.2%に達するという。また、AI画像の品質をユーザーが直接投票で評価するランキング「Image Arena」でも首位を獲得したと報告されている。

99%という数字が意味すること

先行テストを実施したPollo AIは、「左手の親指に緑色の指輪をはめる」という細かい指示を10回試して10回完璧に再現できたと報告した。これまでなら指輪の色がずれる、位置がおかしい、そもそも消える——そういった修正作業が必ず発生していた。それが不要になった、という評価だ。

日本語など非英語圏の文字も対応

この精度向上は日本語でも変わらない。リリース直後から導入したSHIFT AIやUravationでは、広告バナーやSNS広告クリエイティブの制作において、日本語テキストの精度が99%を超えたことで「生成後の文字打ち替え工程」をほぼゼロにできたという。日本語のロゴやキャッチコピーを含む素材が「一発生成」で最終成果物として成立する水準に達した、というのが現場からの評価だ。

広告・チラシ・パッケージ制作が最終成果物として成立

ポスター・チラシ・SNS広告が「そのまま使える」品質に

「AIで絵を出し、あとから文字を乗せる」——その二段階が一段階になった。生成した画像がそのまま納品物になる。

この変化は日本語テキストの扱いだけに限らない。価格、イベントの日付、複数の商品名が並ぶチラシ——「間違えたら事故になる情報」をAIに任せることは、従来は難しかった。それが修正なしで出力できる水準になったという。

1回の指示から、同一ブランドカラーを維持した画像を最大8枚同時生成する機能も加わった。SNS広告で縦長・横長など複数フォーマットを揃える作業が、一度の操作で完結する。

商品パッケージとUIモックアップにも実用レベル

商品パッケージへの応用も現実的になっている。曲面に載る細かい文字、多言語で書かれた成分表示ラベルも正確にシミュレーションできる水準だ。アプリやWebサービスの画面設計を確認するためのUIモックアップにも活用されており、テキストが正確に表示されることで、デザインの確認サイクルが短縮されている。画質は雑誌の見開きや大型ポスターに耐える水準で、印刷物への応用も現実的な選択肢に入った。