最近の中国のAIの勢いは凄まじいものがありますね。Baiduからも最新のAIモデルが発表されました。解説します。
BaiduのAIモデル、ERNIE X1とERNIE 4.5
先月、中国の大手テクノロジー企業Baiduは、新たなAIモデル「ERNIE X1」と「ERNIE 4.5」を発表しました。これらのモデルは、DeepSeekなどの競合他社に対抗するために開発されました。
ERNIE X1の特徴
- 深い思考と推論能力を持つマルチモーダルモデル
- DeepSeek R1と同等の性能を半額で提供
- 入力1000トークンあたり0.002元、出力1000トークンあたり0.008元の価格設定
- 理解、計画、反省、進化の能力が向上
ERNIE 4.5の特徴
- ネイティブマルチモーダル基盤モデル
- GPT-4.5を上回るベンチマーク性能
- GPT-4.5の1%のコストで運用可能
- 入力1000トークンあたり0.004元、出力1000トークンあたり0.016元の価格設定
市場への影響
- 個人ユーザーに対して無料で提供
- エンタープライズユーザーとデベロッパーはQianfanプラットフォームを通じてAPIにアクセス可能
- アメリカなどのAI企業に対する価格競争力の向上
- オープンソース化の計画(ERNIE 4.5は2025年6月30日から)
今後の展望
- BaiduのAIエコシステムへの統合(Baidu検索、Wenxiaoyanアプリなど)
- AI、データセンター、クラウドインフラへの継続的な投資
- より高度な次世代モデルの開発
この発表は、中国のAI産業の急速な発展と、グローバルAI市場での競争激化を示しています。Baiduの戦略は、高性能なAIモデルを低コストで提供することで、市場シェアの拡大を目指しています。
具体的に何が出来るのか?
ERNIE 4.5は、テキスト、画像、音声、動画など多様なデータ形式を統合的に理解・処理できるマルチモーダルAIモデルです。具体的な機能は以下の通りです。
- テキスト、画像、音声、動画の統合的な理解と生成
- インターネットミームや風刺漫画の文脈理解
- 高度な言語理解、生成、推論、記憶能力
- 低コストでの利用(GPT-4.5の1%の価格)
ERNIE X1は、深い思考と推論を可能にするモデルで、以下の機能があります。
- 中国語の知識問答、文学創作、文章執筆、対話、理論的推論、複雑な計算
- 高度なツール利用(進化型検索、文書問答、画像理解、AI画像生成、コード解釈、ウェブページ読み取りなど)
- 低コストでの利用(DeepSeek R1の半分の価格)
これらのモデルは、個人利用者に無料で提供され、企業向けにはAPIを通じて利用可能です。
まとめ
中国の大手テクノロジー企業のBaiduは、ERNIE X1とERNIE 4.5という2つの新しいAIモデルを開発しました。これらは、考えたり学習したりできる超賢いロボットのようなものです。ERNIE X1はより安価で、R1という別のAIと同じように機能します。ERNIE 4.5は、単語、画像、音声など、さまざまな種類の情報をすべて理解するのに非常に優れています。Baiduは、他の企業と競合しているため、これらの新しいAIで人気を得たいと思っていますが、最初のAIモデルであるERNIEを多くの人に使用してもらうのに苦労しているのも事実です。ですがBaiduの新しいAIモデルは人気を得るためのポテンシャルを持っているのも事実です。