深層学習革命【第三章・第5話】

2012年9月30日、AlexNetがImageNetコンペで誤り率を一気に半減させ、深層学習革命の火がついた。技術は新しくなかった——変わったのは規模(ImageNetの大量データ・GPU・冬を生き延びた研究者)。二度葬られたニューラルネットが覇権を握り、トランスフォーマーを経て現在のChatGPT・Claudeへ。三度目の春は本物か?aigeek.biz編集長との対話、第三章・第5話。

AI はどうやって絵を描くのか —— 砂嵐から像を彫り出す仕組み

画像生成AIは、テキスト生成とは逆の仕組みで動いている。砂嵐(ノイズ)から少しずつ像を彫り出す「拡散モデル」とは何か。テキストの足し算、画像の引き算という対比を、彫刻家のたとえと図解で腑に落とす。動画生成や最新の潮流まで、対話ベースで解説。

AIが「文字を書けない」は過去の話になった

OpenAIのChatGPT画像生成が「文字化け」という長年の課題を克服。言語モデルと画像生成を統合した新技術により、文字精度が飛躍的に向上。広告・資料制作の現場では作業時間が大幅短縮される見込み。日本語対応も進展中で、ビジネスの効率化が加速する。

AIが「文字化け」を卒業した日

OpenAIの画像生成AI「ChatGPT Images」が克服した文字化け問題。言語モデルとの統合で正確な日本語描画が実現され、ビジネス実務でのAI活用が本格化。中小企業のデザインコスト削減から創造的な仕事の変化まで、その影響を深掘り解説します。