中国企業ディープシークが低い開発コストで高性能のAIモデルを公開
1月20日にトランプ米大統領が就任して以降、米国のAI技術の優位性についての世界の見方は、大きく揺れることになった。
1月21日にトランプ大統領がソフトバンクの孫正義会長、OpenAIのサム・アルトマンCEO、オラクルのラリー・エリソン会長らと記者会見を行い、AI開発の共同出資の新会社スターゲートに最大5,000億ドル(約78兆円)を投資すると発表した。AI技術の開発にはデータセンターなどに巨額の投資をする必要があると考えられており、この計画によって、米国のAI技術の優位性がより高まったと広く受け止められた。
しかしそのわずか数日後に、こうした見方は大きな疑問に晒されることになった。それは、中国企業ディープシーク(深度求索)が、計算・コード・推論の各タスクに関して米オープンAIのモデルと同じくらい高機能だと主張する新モデル「R1」を公開したことだ。他方で、開発費用はかなり小さいと説明された。
ディープシークがAIモデルの学習に必要とした半導体は、他の先進AIモデルよりはるかに少なく、開発コストはわずか560万ドル程度とされる。米オープンAIのサム・アルトマンCEOによると、2023年終盤に提供が開始された同社の「GPT-4」の訓練には、1億ドル余りの費用がかかったという。また米アンソロピックのダリオ・アモデイCEOは昨年、ポッドキャストで一部モデルの訓練費用が10億ドルに近づいていると述べていた。
1月21日にトランプ大統領がソフトバンクの孫正義会長、OpenAIのサム・アルトマンCEO、オラクルのラリー・エリソン会長らと記者会見を行い、AI開発の共同出資の新会社スターゲートに最大5,000億ドル(約78兆円)を投資すると発表した。AI技術の開発にはデータセンターなどに巨額の投資をする必要があると考えられており、この計画によって、米国のAI技術の優位性がより高まったと広く受け止められた。
しかしそのわずか数日後に、こうした見方は大きな疑問に晒されることになった。それは、中国企業ディープシーク(深度求索)が、計算・コード・推論の各タスクに関して米オープンAIのモデルと同じくらい高機能だと主張する新モデル「R1」を公開したことだ。他方で、開発費用はかなり小さいと説明された。
ディープシークがAIモデルの学習に必要とした半導体は、他の先進AIモデルよりはるかに少なく、開発コストはわずか560万ドル程度とされる。米オープンAIのサム・アルトマンCEOによると、2023年終盤に提供が開始された同社の「GPT-4」の訓練には、1億ドル余りの費用がかかったという。また米アンソロピックのダリオ・アモデイCEOは昨年、ポッドキャストで一部モデルの訓練費用が10億ドルに近づいていると述べていた。
揺らぐ高い参入障壁と「スプートニク・モーメント」
このようにAI技術の開発に巨額の費用が必要であることは、米国の大手IT企業が世界でその優位性を維持するための、新規参入障壁となっていると考えられていた。
さらに、バイデン前政権が導入した、中国への先端半導体関連の輸出規制も、中国に対する米国のAI技術の優位性を揺るぎないものにしていると考えられてきた。近年の米国市場でのAIブームも、そうした前提のもとに成り立っていたのである。
ところがディープシークのR1によって、それがにわかに疑問視されることになった。米国企業がAI技術の先駆者としての地位を失う可能性さえも意識され始めた。そうした懸念は、米国市場での半導体などIT・AI関連の株価に大きな打撃を与え、「ディープシーク・ショック」と呼ばれる状況を生んでいる。
これを、人工衛星の打ち上げで米国がソ連に先を越された事例になぞらえ、「AI版のスプートニク・モーメント」と呼ぶ向きもある。
さらに、バイデン前政権が導入した、中国への先端半導体関連の輸出規制も、中国に対する米国のAI技術の優位性を揺るぎないものにしていると考えられてきた。近年の米国市場でのAIブームも、そうした前提のもとに成り立っていたのである。
ところがディープシークのR1によって、それがにわかに疑問視されることになった。米国企業がAI技術の先駆者としての地位を失う可能性さえも意識され始めた。そうした懸念は、米国市場での半導体などIT・AI関連の株価に大きな打撃を与え、「ディープシーク・ショック」と呼ばれる状況を生んでいる。
これを、人工衛星の打ち上げで米国がソ連に先を越された事例になぞらえ、「AI版のスプートニク・モーメント」と呼ぶ向きもある。
想定される3つの要因
ディープシークが自ら説明したように、極めて限られた開発費で高機能のAIモデルの構築に成功したとする場合、その理由はいくつか考えられる。
第1は、AIモデルを訓練するのに必要なデータ処理量を減らしたことだ。米オープンAIの対話型AI「チャットGPT」などのプログラムを下支えする先進的なAIモデルは、大量に集めたテキストや画像などのデータを使って学習を行った。そこには大量の先端半導体を投入したデータセンターが必要であり、それは大量の電力を消費し、コストがかかる。
ディープシークは、AIがチャットボットで回答するために事前に大量の学習を行うのではなく、質問を受けてから答えを探しに行くという手法とされる。質問を受ける前に必要とされる時間と電力消費がより少なくなる一方で、答えを出すために使われる時間と電力消費が多くなる。これは、イノベーションの一つなのだろう。
第1は、AIモデルを訓練するのに必要なデータ処理量を減らしたことだ。米オープンAIの対話型AI「チャットGPT」などのプログラムを下支えする先進的なAIモデルは、大量に集めたテキストや画像などのデータを使って学習を行った。そこには大量の先端半導体を投入したデータセンターが必要であり、それは大量の電力を消費し、コストがかかる。
ディープシークは、AIがチャットボットで回答するために事前に大量の学習を行うのではなく、質問を受けてから答えを探しに行くという手法とされる。質問を受ける前に必要とされる時間と電力消費がより少なくなる一方で、答えを出すために使われる時間と電力消費が多くなる。これは、イノベーションの一つなのだろう。
米国の中国向け先端半導体の輸出規制の抜け道
第2は、ディープシークが、米国から中国に対して行っている先端半導体の輸出規制の影響を一部回避し、先端半導体を入手してAIモデルを開発した可能性だ。
バイデン政権は2022年に、中国向け先端半導体及びその製造装置の輸出規制を導入した。規制の対象となる先端半導体かどうかは、データ転送スピードを左右する相互接続帯域幅を基準にして判断された。
そこで、AIチップの設計で世界をリードするエヌビディアは、相互接続帯域幅を抑えた中国向け新製品GPU「H800」を開発したのである。この製品は、規制の要件を満たしつつも、他の点では高い性能を維持し、当時のエヌビディアの最先端GPU(画像処理半導体)とほぼ同等の性能を持つ製品が生まれたとされる。これを用いて、ディープシークがAIモデルの開発を進めた可能性が考えられる。
バイデン政権は、この規制の抜け道を塞ぐために、後に規制を強化したが、ディープシークはエヌビディアのGPU「H800」を1年間は購入できた。
第3は、他のAIモデルから「蒸留」を行ったことだ。「蒸留」とは、既存のAIモデルの入力と出力のデータを使って新たなAIに学習させることだ。それによって、大量のデータを集めてAIに学習をさせる手間を省くことができる。
トランプ米政権で暗号資産とAIの責任者に起用されたデービッド・サックス氏は28日に、中国のディープシークが米オープンAIのモデルから知識を蒸留したという相当な証拠がある、と語った。
オープンAI のGPTシリーズなどの大規模な言語モデルは、その詳細なトレーニングデータや内部の仕組みが公開されていない、クローズドソースである。ディープシークが米オープンAIのモデルから蒸留した場合には、不正入手の可能性も考えられる。実際、マイクロソフトとオープンAIは、ディープシークと関連のあるグループが、オープンAIの技術から出力されたデータを不正な方法で入手したかどうかを調査している、との報道もある。
バイデン政権は2022年に、中国向け先端半導体及びその製造装置の輸出規制を導入した。規制の対象となる先端半導体かどうかは、データ転送スピードを左右する相互接続帯域幅を基準にして判断された。
そこで、AIチップの設計で世界をリードするエヌビディアは、相互接続帯域幅を抑えた中国向け新製品GPU「H800」を開発したのである。この製品は、規制の要件を満たしつつも、他の点では高い性能を維持し、当時のエヌビディアの最先端GPU(画像処理半導体)とほぼ同等の性能を持つ製品が生まれたとされる。これを用いて、ディープシークがAIモデルの開発を進めた可能性が考えられる。
バイデン政権は、この規制の抜け道を塞ぐために、後に規制を強化したが、ディープシークはエヌビディアのGPU「H800」を1年間は購入できた。
第3は、他のAIモデルから「蒸留」を行ったことだ。「蒸留」とは、既存のAIモデルの入力と出力のデータを使って新たなAIに学習させることだ。それによって、大量のデータを集めてAIに学習をさせる手間を省くことができる。
トランプ米政権で暗号資産とAIの責任者に起用されたデービッド・サックス氏は28日に、中国のディープシークが米オープンAIのモデルから知識を蒸留したという相当な証拠がある、と語った。
オープンAI のGPTシリーズなどの大規模な言語モデルは、その詳細なトレーニングデータや内部の仕組みが公開されていない、クローズドソースである。ディープシークが米オープンAIのモデルから蒸留した場合には、不正入手の可能性も考えられる。実際、マイクロソフトとオープンAIは、ディープシークと関連のあるグループが、オープンAIの技術から出力されたデータを不正な方法で入手したかどうかを調査している、との報道もある。
AI分野のゲームチェンジャーとなるか
ディープシークが限られた開発費で高機能のAIモデルを構築できた背景には、以上のような3つの要因が主に考えられるが、事実関係を含めてなお不明確な点が多い。
ただし、ディープシークのR1は、仮に米国のAI技術の優位性を危うくするものであるとしても、それは世界のAI技術の進歩を促すものである可能性があるだろう。AI分野のゲームチェンジャーとなるかもしれない。
また、それがAI分野への企業の新規参入を促すきっかけとなれば、AI技術のさらなる発展を後押しすることにつながるかもしれない。また、大量に消費する電力の制約も緩和される可能性があるのではないか。
他方でこの「ディープシーク・ショック」は、トランプ大統領のもとで、中国への先端半導体輸出規制を一段と強化させ、米中間の対立をより激化させるきっかけになる可能性もあるだろう。ロイター通信は、ホワイトハウスがディープシークによる国家安全保障上のリスクを審査し始めたとも報じている。
このようにディープシーク・ショックがもたらす影響は、特に米国にとってはプラス、マイナスの双方が考えられ、その行方はなお不透明ではある。ただし、それが近年の米国株式市場でのユーフォリア的な「AIブーム」に一石を投じたことは確かであろう。今までのような強気一辺倒の市場は続きにくくなるのではないか。
(参考資料)
"How China's DeepSeek Outsmarted America(中国ディープシーク、どうやって米国を出し抜いたか)", Wall Street Journal, January 29, 2025
"DeepSeek Won't Sink U.S. AI Titans(ディープシーク躍進、それでもAIの巨人は沈まず)", Wall Street Journal, January 28, 2025
"The DeepSeek AI Freakout(ディープシークAIの衝撃)", Wall Street Journal, January 28, 2025
ただし、ディープシークのR1は、仮に米国のAI技術の優位性を危うくするものであるとしても、それは世界のAI技術の進歩を促すものである可能性があるだろう。AI分野のゲームチェンジャーとなるかもしれない。
また、それがAI分野への企業の新規参入を促すきっかけとなれば、AI技術のさらなる発展を後押しすることにつながるかもしれない。また、大量に消費する電力の制約も緩和される可能性があるのではないか。
他方でこの「ディープシーク・ショック」は、トランプ大統領のもとで、中国への先端半導体輸出規制を一段と強化させ、米中間の対立をより激化させるきっかけになる可能性もあるだろう。ロイター通信は、ホワイトハウスがディープシークによる国家安全保障上のリスクを審査し始めたとも報じている。
このようにディープシーク・ショックがもたらす影響は、特に米国にとってはプラス、マイナスの双方が考えられ、その行方はなお不透明ではある。ただし、それが近年の米国株式市場でのユーフォリア的な「AIブーム」に一石を投じたことは確かであろう。今までのような強気一辺倒の市場は続きにくくなるのではないか。
(参考資料)
"How China's DeepSeek Outsmarted America(中国ディープシーク、どうやって米国を出し抜いたか)", Wall Street Journal, January 29, 2025
"DeepSeek Won't Sink U.S. AI Titans(ディープシーク躍進、それでもAIの巨人は沈まず)", Wall Street Journal, January 28, 2025
"The DeepSeek AI Freakout(ディープシークAIの衝撃)", Wall Street Journal, January 28, 2025
プロフィール
-
木内 登英のポートレート 木内 登英
金融ITイノベーション事業本部
エグゼクティブ・エコノミスト
1987年に野村総合研究所に入社後、経済研究部・日本経済調査室(東京)に配属され、それ以降、エコノミストとして職歴を重ねた。1990年に野村総合研究所ドイツ(フランクフルト)、1996年には野村総合研究所アメリカ(ニューヨーク)で欧米の経済分析を担当。2004年に野村證券に転籍し、2007年に経済調査部長兼チーフエコノミストとして、グローバルリサーチ体制下で日本経済予測を担当。2012年に内閣の任命により、日本銀行の最高意思決定機関である政策委員会の審議委員に就任し、金融政策及びその他の業務を5年間担った。2017年7月より現職。
※組織名、職名は現在と異なる場合があります。