/note/tech

ついに来た拡散言語モデル

Inceptionという会社のMercuryという拡散言語モデルがすごい。

いつか出るだろうと思っていたのだが、なかなか姿を見せなかった、拡散言語モデルである。

いまAIは、「頭の良さの差」を競う段階に来ている。

「頭の良さ」を測る尺度はたくさんあるが、僕は答えの用意されたテストを解くことをたいして良い尺度だと思っていない。まあ答えの用意されたテストしか解いてこなかった人たちにはそれでも十分な尺度なのだと思うが。

拡散モデルは、画像生成の世界ではトップランナーだった。

最近は拡散TransformerのFLUXのようなものが台頭してきたが、速度という点では未だに拡散モデルに軍配があがる。

ただし画像の拡散モデルも、「正確さ」という点ではなかなか厳しいものがある。

しかしMercuryは、速い上に正確な答えを出す。