HEDTプラットフォームの終焉
IntelがCore XプロセッサことCascade Lake-XおよびGlacier Fallsプラットフォームの終息を発表した。AMDもRyzen Threadripper 5000シリーズではワークステーション向けのPROプロセッサしか投入しておらず、HEDTプラットフォームはIntel、AMDともに終息したことになる。そもそもHEDTプラットフォームとはどうして現れ、どうして去っていったのだろうか。また帰ってくる日はあるのだろうか。歴史を振り返ってみよう。
HEDTプラットフォームのこれまで
前史
そもそも古代においてはx86プロセッサのプラットフォームは現代のように細分化されていなかった。Pentium Proが発売された1995年がサーバ向けプロセッサの分化の始まりだろうか。当時プラットフォームが分化したのはSMP対応やキャッシュメモリの違い等が理由だろう。現代からすると信じられないが、当時は1ソケット/スロットに1プロセッサが当たり前でマルチプロセッサ=マルチソケット/スロットだったのだ。Pentium IIは2CPUまでのSMPに対応していたので、ローエンドサーバやワークステーションまでは共通の環境でカバーしていたが、Pentium Proは4CPUまでのSMPに対応していたので後継としては不十分だった。IntelがPentium Proの後継として投入したサーバ向けプロセッサがPentium II Xeonである。これが現在まで続くXeonブランドの起点だ。Pentium IIの後継であるPentium IIIまでは2CPUのSMPに対応していたが、Pentium 4ではSMPに対応しなかった。Netburstマイクロアーキテクチャの世代では2CPUのSMPに対応したCPUもXeonブランドに組み込まれ、4CPUのSMPに対応するプロセッサはXeon MPブランドで発売された。そのため当時の自作PC板では個人でPrestoniaを使用しているエンスージアストが散見された。
HEDTプラットフォームの誕生
90年末期はx86プロセッサの動作周波数が急速に向上した時代であり、Intelとx86互換プロセッサの最大手AMDは熾烈な争いを繰り広げていた。IntelのPentium IIIとAMDのAthlonのどちらが先に1GHzの大台に先に到達するかに注目が集まり、2000年3月にAMDが2日早く1GHz AthlonをリリースしたことでAMDがクロック競争のマイルストーンに先に到達したとみられた。(参考)しかしながらIntelがPentium IIIやAthlonよりも遥かに高クロックで動作するPentium 4を投入したことによりK7 Athlonは陳腐化し、AMDは一気に突き放された。後継のK8は開発が遅れており(これも現代からすると信じられないかもしれないが当時AMDにはよくあることでありペーパーローンチと揶揄されていた)、遅れの挽回は容易ではなくなっていた。そこで逆転のための秘策として用意されたのがAthlon 64 FXとSocket 940を組み合わせた環境であった。メインストリームのコンシューマ向けデスクトップ環境とは異なるHEDT環境の誕生である。
Athlon 64 FXは実質的にサーバ向けプロセッサであるOpteronと同一のプロセッサであり、メインストリーム向けのSocket 754版Athlon64と同様2003年に投入された。メインストリーム向けのSocket 754版Athlon 64のメモリがシングルチャネルで動作したのに対し、Athlon 64 FXはデュアルチャネルで動作したことからより高性能だった。2004年にはメインストリーム向けのAthlon 64もSocket 939に移行しデュアルチャネルに対応したことからAthlon 64 FXもSocket 940からSocket 939に移行し、AMDのコンシューマ向けプラットフォームは統一された。
2006年にIntelがCore 2 Extreme QX6700としてx86史上初のクアッドコアプロセッサを投入したことでAMDは再び対応を迫られた。クアッドコアに対応したPhenomプロセッサは開発が遅れており、繋ぎとして投入されたのがQuad FXプラットフォームである。かつてのSocket 940版Athlon 64 FXと同様Opteronをベースとしたプロセッサであるが、今回はレジスタードメモリではなくアンバッファードメモリに対応しておりOpteronと差別化されていた。
2度のAthlon 64 FXの事例の通り、HEDT環境が投入される最もありがちであり理解もしやすいのが「通常のコンシューマ向け環境では競合他社に勝てないのでサーバ向け環境を流用した環境をコンシューマ向けとして投入した」という理由である。
その次に投入されたHEDT環境が2008年2月に披露されたIntelのSkulltrailである。2度のAthlon 64 FXの事例と同様にサーバ向けプラットフォームを流用しており、2CPUのSMPに対応していた。Athlon 64 FXと異なるのは理由である。当時のIntelはプロセス微細化で先行しており、AMDは微細化の遅れとPhenomのTLBエラッタ問題により苦戦していた。Intelは2008年11月にNehalemマイクロアーキテクチャに基づいたBloomfield Core i7プロセッサとLGA1366を投入するのだが、このときPentium Pro以来のFSBからQPIにインターコネクトが移行しメモリコントローラもCPUに統合するなどかなり大きな変更が行われた。DDR3の登場によりお蔵入りが決定していたFB-DIMMなども使用されていることから、Skulltrailは技術的到達点の誇示を意図したものだったのだろう。
継続したIntelのHEDTプラットフォーム
さて、次のHEDT環境はそのBloomfieldとLGA1366を組み合わせた環境だ。系譜からいうとこの環境が今回終息したCascade Lake-Xの源流にあたる。この環境はごく一部のエンスージアスト向けの特殊なプラットフォームではなくハイクラス向け環境としてターゲットを拡大して投入されたのが印象的だ。おそらくHEDT環境が最も普及した世代だろう。競合たるAMDは微細化に苦戦し依然として45nmプロセスで製造されたPhenom IIを投入できておらず、メインストリーム向けはPenryn世代のCore 2プロセッサで十分対抗できていたため、Nehalemマイクロアーキテクチャを採用するメインストリーム向けのプラットフォームであるLGA1156環境は1年近く遅れた2009年9月まで投入されなかった。しかも廉価版のPentium Dual-Coreなどは2010年になっても新製品が投入されるような状況で、LGA775プラットフォームはなかなか終息せず、当時の自作PC板では「Core iにはいかねえよ」スレッドが立てられるなどしていた。
そうした状況で投入されたBloomfieldとLGA1366は何を意図したものだったのだろうか。一言でいえば足回りの強化だ。CPU-ノースブリッジ間のインターコネクトがFSBからQPIに代わりメモリコントローラがCPUに内蔵されたことでメモリアクセスが高速化した。しかもBloomfieldのメモリコントローラはDDR3のトリプルチャネルに対応していたのでDDR2のデュアルチャネルだったPenrynよりもはるかに広帯域だ。
Nehalemマイクロアーキテクチャに続くSandy BridgeマイクロアーキテクチャでもIntelはHEDTとメインストリームでプラットフォームを分けた。他社との競争という意味では出す必要のない製品群であったが、それでも投入したのはBloofield/Gulftownのからの移行先が必要だったこと、そしてマルチGPUに対応した環境が必要だったことが理由だろう。Nehalemマイクロアーキテクチャのメインストリーム向けプロセッサであるLynnfieldはメモリコントローラに加えてPCI-Expressコントローラも内蔵した。バスのコントローラをCPUに内蔵したほうが当然遅延が減るためパフォーマンスは向上する。この流れを汲んでSandy Bridge世代ではすべてのプロセッサがPCI-Expressコントローラを内蔵した。
この状況でメインストリームとHEDTのプラットフォームを統合しようとしたときに問題になるのがグラフィックボードである。現在ではこれも信じられないかもしれないが、当時のゲーマー向けのハイエンド環境はグラフィックボードを複数差していたのだ。3dfxのVoodoo2を嚆矢として、2大GPUメーカーのNVIDIAとATI/AMDはそれぞれSLIとCrossFireというブランドでマルチGPU環境を提供していた。LGA775の環境ではPCI-Expressコントローラがチップセットに内蔵されていたため、チップセットごとにPCI-Expressのレーン数を変えることで同じソケットでハイエンドとメインストリーム向けに作り分けることができていた。しかしPCI-ExpressコントローラがCPUに内蔵されたことでマルチGPU環境向けにはより多くのPCI-Expressコントローラを内蔵したCPUと対応するプラットフォームが必要になったのである。
こうしたマルチGPU環境にはGPU間のインターコネクトの制約からゲームごとの最適化が重要となる。翻せばゲームによっては性能が向上しなかったり、描画が不安定になったりするということだ。VRAMの広帯域化が進んだことと、プロセス微細化によりその帯域幅を生かし切れる膨大な演算器を単体のGPUに押し込められるようになったことから単体のGPUでも十分すぎるパフォーマンスを得られるようになり、2010年代後半にマルチGPU環境は衰退することになる。
競合製品が存在しないこと、そしてなによりIntel自身がプロセス微細化とサーバ向けプロセッサの開発に苦戦していたことからHEDT向け環境の投入はメインストリーム向け環境から年単位で遅れるようになった。メインストリーム向けのSkylakeが2015年に投入されたのに対し、Skylake-Xは2017年まで待たなければならなかった。
Ryzen Threadripperの登場
Intelの競合たるAMDはK10マイクロアーキテクチャのPhenomではプロセス微細化に苦しみK7 AthlonからK8 Athlon 64で築いたシェアを失っていった。そしてK10の後継となるBulldozerマイクロアーキテクチャが想定したようなパフォーマンスを出せなかったことで完全に市場で存在感を失った。AMDはBulldozerの失敗のあと、起死回生の一手としてZenマイクロアーキテクチャを開発し、2017年にサーバ向けはEPYC、デスクトップ向けはRyzenとしてブランドを一新した製品群を投入して攻勢に出た。EPYCとRyzenはIntelの製品に対して十分な競争力を持っていた。そしてすべての市場でIntelに対抗するべくAMDが投入したのがRyzen Threadripperである。
Zenアーキテクチャ世代のRyzen ThreadripperのCPUコア数は最大で16、メモリはDDR4のクアッドチャネル、PCI-Expressレーン数は64だった。IntelもSkylake-Xで18コアのCore i9-7980XEを急遽投入するなどして対抗し、IntelとAMDがHEDTプラットフォーム同士で競い合うというかなり珍しい展開となった。翌年AMDはターボブーストなどの制御を強化したZen+アーキテクチャ世代でもHEDT向けのRyzen Threadripper Xプロセッサを投入したが、このときわずかではあるがワークステーション向けのRyzen Threadripper WXプロセッサが先行して投入された。そして2019年のZen2アーキテクチャ世代ではメインストリーム向けプラットフォームのSocket AM4で最大16コアのRyzen 9プロセッサが投入されRyzen Threadripperがカバーする領域は縮小した。
IntelもRyzenシリーズによるAMDの攻勢を座してみているわけではなかったが、10nmプロセスの開発の失敗により製品開発にも混乱が生じたため対抗できる製品群を提供できなかった。メインストリーム向けプラットフォームでもCoffee Lakeで6コアのCore i7-8700K、Coffee Lake Refreshで8コアのCore i9-9900Kを導入したが、Ryzen 9 3950Xの16コアの前には対抗できないのは明らかだった。こうした状況で出てきたのがサーバ向けSkylakeのマイナーチェンジ版の製品群であるCascade Lakeに基づくCascade Lake-Xだ。なりふり構わないIntelはCascade Lake-XをSkylake-Xのほぼ半値で販売した。最上位となるCore i9-10980XEは18コアで979ドルであり、24コアのRyzen Threadripper 3960Xよりもメインストリーム向けプラットフォームのRyzen 9 3950Xに近い値付けがされていたことからも、これが苦肉の策であったことがうかがえる。Athlon 64 FXと同様「通常のコンシューマ向け環境では競合他社に勝てないのでサーバ向け環境を流用した環境をコンシューマ向けとして投入した」わけだ。
HEDTプラットフォームの衰退
こうしてRyzen Threadripper 3000シリーズは競合の存在しない孤高のHEDTプロセッサとなったわけだが、あまり存在感のない製品でもあった。一般的な用途で24コアや32コアも使用するのは動画エンコードくらいだがそのエンコードでGPUを使用するのが主流になったこと、マルチGPU環境が衰退したこと、PCI-Express 4.0になりHEDT用途であってもGPUに16レーン、NVMe SSDに4レーン、チップセットに4レーンの計24レーンで支障なくなったことあたりが理由だろう。
その後Intelも長年の微細化の苦しみを乗り越え、Intel 7プロセスに基づくAlder Lakeを投入した。Alder LakeはDDR5/PCI-Express 5.0に対応したプロセッサであり、Core i9-12900Kは8+8コアでハイブリッド構成とはいえ単純なコア数で競合のRyzen 9 5950Xの16コアに追いついた。こうしてメインストリーム向けプラットフォームで投入されたハイエンドCPUが同士が激しく競いあうようになり、この構図が2023年現在まで続いている。
しかしメインストリーム向けプラットフォームでの競争が盛り上がるのと反比例するようにコンシューマ用途でのHEDTプラットフォームは存在意義を失いひっそりと退場した。AMDがZen 3世代のRyzen Threadripperとして投入したのはワークステーション向けのプロセッサのみであり、IntelもCascade Lake-Xの後継のCore Xは投入しないまま終息を発表し、ここにHEDTプラットフォームは消滅した。今後メインストリーム向けの環境よりも広帯域のメモリや多くのPCI-Expressレーンを要求する場合はワークステーション向けの環境を使用することになるが、これまでよりもコストがかかるようになるだろう。
まとめ
これまでメインストリーム向けのプラットフォームとは異なるHEDTプラットフォームが導入されてきた理由は次の3つに大別される。
- メインストリーム向けのプラットフォームでは競合他社の製品に対抗できる製品を提供できない場合(Athlon 64 FX, Cascade Lake-X)
- 技術的到達点の象徴(Skulltrail)
- ビジネス用途などで利用されるメインストリーム向けのプラットフォームでは提供できない、ないしは提供しようとするとコストがかかりすぎるためエンスージアスト向けのプラットフォームを分割したほうが合理的である場合(Core X, Ryzen Threadripper)
現状Intel、AMDともにメインストリーム向けのプラットフォームで激しく競い合っていることから最初の理由が満たされることは直近では考えられない。最後の理由については次のような環境の変化から当面満たされることはないだろう。
- コンシューマの用途ではRyzen 9の16コアやCore i9の8+16コアもあれば十分すぎること
- DDR4、そしてDDR5の導入によりメモリ帯域が広がったこと
- プロセッサのLLCが大容量になりメモリ帯域の不足を相当程度隠蔽できていること
- マルチGPU環境が衰退しコンシューマ用途で要求されるPCI-Expressのレーン数が減少したこと
技術的到達点の象徴はともかく、Intel、AMDともに現状HEDT向けにメインストリーム向けと異なるプラットフォームを導入する理由が乏しく、なんらかの市場の変化がない限りHEDT向けプラットフォームが導入されることはないだろう。