世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-09

テンセントが高性能推論モデル「Hy3 preview」を公開、295B規模でも効率を重視したMoEモデル

キーポイント

テンセントが新しい推論モデル「Hy3 preview」をオープンソースで公開
総パラメータ2950億、アクティブパラメータ120億のMoEモデル
最大25万トークンの長い文脈を扱える
推論モードを3種類備え、速度と深い思考のバランスを調整できる
ベンチマークでは前モデルHy2より大きく改善
Gemini 3.1 ProやGPT-5.4 xhighに匹敵する結果もあるとテンセントは主張
Hugging Face、GitHub、APIの3方向で公開されている

テンセントの「本気の推論モデル」が出てきた

中国の巨大IT企業テンセントが、大規模言語モデルファミリー「Tencent HY」の新モデルとして「Hy3 preview」を公開しました。しかも、ただの研究発表ではなくオープンソース公開です。ここはかなり重要で、実際に触ったり改良したりしやすい形で出してきた、ということになります。

最近のAI界隈は「とにかく巨大」「でも高い」「でも賢い」という三つ巴の戦いになっていますが、Hy3 previewはその中で**“性能とコスト効率のバランス”**を強く打ち出しているのが面白いところです。正直、こういう方向性はかなり現実的だと思います。モデルが賢くても、使うたびにお金が溶けるようでは普及しませんからね。

Hy3 previewはどんなモデル？

Hy3 previewは、総パラメータ数2950億、アクティブパラメータ数120億のMoE（Mixture of Experts）モデルです。

MoEって何？

ざっくり言うと、MoEはたくさんの専門家チームを持つAIのような仕組みです。
全部のパラメータを毎回フル稼働させるのではなく、必要な専門家だけを呼び出して使うので、巨大なのに比較的効率よく動かせます。

総パラメータ: モデル全体の大きさ
アクティブパラメータ: 実際の推論時に使う部分の大きさ

つまりHy3 previewは、見た目はとても大きいけれど、毎回全部を使うわけではないので、性能と効率を両立しやすい設計になっているわけです。ここはかなり今っぽいです。
「でかいけど無駄に重くしない」という思想、嫌いじゃありません。

さらに、コンテキストウィンドウは最大25万トークン。
コンテキストウィンドウというのは、AIが一度に覚えていられる文章量のことです。25万トークンというのはかなり大きく、長い資料や大量の会話を扱う用途で強そうです。

3つの推論モードがあるのが地味に便利

Hy3 previewには、レイテンシ（返答の速さ）と深度（じっくり考える力）のどちらを優先するかに応じた3つの推論モードがあります。

これは実用上かなり大事です。
たとえば、

すぐ答えがほしいチャット → 速さ重視
難しい数学やコード修正 → 深く考えるモード
エージェント的な複雑作業 → バランス型

みたいに使い分けられるなら、モデルの使い道がかなり広がります。
個人的には、AIは「最高性能の一点突破」だけでなく、場面に応じて挙動を切り替えられることが今後もっと重要になると思います。

テンセントは何を変えたのか

テンセントは2026年2月に、事前学習と強化学習のインフラを再構築したそうです。
そして、実用的なAIを作るための原則として次の3つを挙げています。

体系的な能力
不正操作が可能な公開ベンチマークではなく現実的な評価
コスト効率

この考え方はかなり興味深いです。
AI業界では、ベンチマークの点数を上げること自体はよくありますが、それが本当に現場で役立つかは別問題です。公開ベンチマークは、極端に言えば“試験対策”みたいなことが起こりうるので、テンセントはそこを警戒しているわけです。

ここはかなり筋が通っていると思います。
「テストで強い」より「実際に使って強い」の方が、結局は価値がありますから。

ベンチマーク結果はかなり好調

テンセントによると、Hy3 previewは複雑な推論、指示追従、コンテキスト学習、コーディング、エージェントタスクで大きく改善されたとのことです。

記事では、難易度の高いSTEM系ベンチマークや大学の博士課程入試、中国高校生物オリンピックなどで比較したグラフが紹介されており、前モデルHy2より全体的にスコアが上がっているとされています。

さらに、実務に近いシナリオで作られたベンチマークでは、Gemini 3.1 ProやGPT-5.4 xhighに匹敵するスコアを記録したケースもあるそうです。

ただし、ここはテンセント側の発表なので、読む側としては
「かなり強そうだが、実際の使い勝手は自分で試したい」
くらいの温度感がちょうどいいと思います。ベンチマークは大事ですが、現実の仕事はもっと泥くさいですからね。

コーディングとエージェント用途でも強化

Hy3 previewは、コーディングエージェントや検索エージェントのベンチマークでも競争力のあるスコアを出したとされています。

ここは今のAIトレンドをよく表しています。
単なる会話AIではなく、今は

コードを書く
ツールを呼び出す
情報を探す
複数ステップで作業する

といった**“エージェント”**の能力がかなり重視されています。
つまり、AIが「答えるだけ」から「手を動かす」方向に進んでいるわけです。

Hy3 previewはその流れに乗っていて、しかもオープンソース。
この組み合わせは、研究者や開発者にはかなり魅力的ではないでしょうか。

サイズと性能のバランスが売り

テンセントは、Hy3 previewの特徴の1つとしてパラメータ規模に対する性能の良さを強調しています。

記事中の比較では、Hy3 previewは

Z.aiのGLM-5よりは性能が劣る
ただしパラメータ数は半分以下
Kimi-K2.5とは同等レベルの性能だが、パラメータ数は4倍近く少ない

という立ち位置だと紹介されています。

これはかなり面白いポイントです。
AIモデルの世界では、単純に「大きい＝強い」とは言い切れなくなってきています。むしろ、どれだけ少ない計算でどれだけ出せるかが勝負になりつつあります。

個人的には、この方向性はかなり健全だと思います。
巨大モデルの“殴り合い”も派手で面白いですが、最終的には安く・速く・そこそこ賢いモデルが勝つ場面が増えるはずです。

ただし弱点もちゃんとある

テンセントはHy3 previewについて、ツール呼び出し時のエラー回復が弱いことや、推論ハイパーパラメータへの感度が高いといった既知の制限も認めています。

ここが好印象です。
AI企業の発表は、どうしても“良い話”ばかりになりがちですが、テンセントは現時点での弱点も明示していて、かなり実務的です。

ツール呼び出しの失敗に強くない
設定次第で挙動が変わりやすい

というのは、実際の運用では地味に重要です。
「デモでは動いたけど本番では怪しい」というのはAIあるあるなので、ここを今後どう改善するかが見どころだと思います。

どこで試せる？

Hy3 previewは以下で公開されています。

Hugging Face
GitHub
API

APIの料金は、0〜16K入力ティアの場合で

入力: 100万トークンあたり1.2元（約28円）
出力: 100万トークンあたり4元（約94円）

です。

この価格はかなり攻めています。
もちろん用途や条件で変わるので単純比較はできませんが、**高性能モデルを“安く使えるかもしれない”**という期待は十分あります。ここは実際にサービスを作る人ほど刺さるはずです。

まとめ：テンセントは「実用AI」の勝負に本気

Hy3 previewは、単に巨大なだけのモデルではなく、効率性、長文処理、推論、コーディング、エージェント対応まで含めて、かなり総合力を狙ったモデルだと感じます。

特に印象的なのは、テンセントが「ベンチマークの見栄え」よりも現実の使い勝手とコスト効率をかなり意識している点です。
AIは性能競争のフェーズを抜け切ってはいませんが、同時に「どう実際に使われるか」のフェーズにも入っています。Hy3 previewは、その流れをよく表すモデルだと思います。

今後気になるのは、

実際の使用感はどうか
既知の弱点はどこまで改善されるか
オープンソースコミュニティでどこまで育つか

あたりです。
発表時点ではかなり強そうですが、本当の勝負はここからではないでしょうか。

参考: テンセントが高性能推論モデル「Hy3 preview」を公開、295B-A21BなMoEモデルで高い効率性 - GIGAZINE

同じ著者の記事

ChatGPTの会話履歴が消えた・表示されないを直す【2026年6月版】

「昨日まであった会話が、サイドバーから消えている」——ChatGPT 利用者の定番の不安だ。だが2026年の今は、1年前とは原因も設定画面もすっかり変わっている。最大の変化は、(1) かつての対処の定番だった 「Chat history & training（会話履歴とトレーニング）」トグルが廃止され、データ設定が再編されたこと。そして (2) 「アーカイブ」「一時チャット（Temporary Chat）」「プロジェクト」といった、履歴が“消えたように見える”新しい仕組みが増えたことだ。本稿では2026年時点で本当に効く見極めと対処を、頻度の高い順に整理する。 > ⚠️ 注記: ChatGPT は UI と設定項目の変更が速い。下記は本稿執筆時点（2026年6月）の挙動。「削除」した会話は UI・API・サポートのいずれからも復旧できないのは今も同じ。まずは「本当に削除したのか」を疑うこと。 --- 2026年は「消えた≠削除」が大半。まず アーカイブ / 一時チャット / 別アカウント の3つを疑う **昔の「会話履歴とトレーニング」ト

papoo.work

Metaの社員追跡ツール、一時停止へ　社内データ漏えいで何が起きたのか

Metaが、社員の作業状況を追跡する社内ツールをいったん止めました。理由はかなり皮肉で、社員の入力データが社内で見える状態になっていたからです。「人の行動を細かく集める仕組み」を作った会社が、そのデータの扱いでつまずいた。こういう話は、技術企業ではよくあるように見えて、実はかなり重いです。監視と安全管理は、ほんの少し歯車がずれるだけで一気に信頼問題になるからです。 Metaは社員向けの追跡ツール「Model Compatibility Initiative（MCI）」を一時停止した MCIはマウス操作、クリック位置、キー入力、画面内容などを集める仕組みそのデータを含む内部データベースが、社内の想定より広い範囲に見える状態になっていた Metaは「不正アクセスの兆候はない」としつつ、調査のため停止したと説明この件で、社員の反発が強いツールにさらに火がついた形になった Metaが導入したMCIは、4月に米国の社員向けに始まりました。名前はおだやかですが、やっていることはなかなか強烈です。記事によると、このツールはマウスの動き、クリックした場所、キー入力、さらには画面の内容まで集めます

papoo.work

Gaussian Splatを“印刷”する、という発想がかなり面白い

Gaussian Splat（ガウシアン・スプラット）を実物として出力してしまう。Dany Bittelさんの短い投稿は、その珍しい体験を素直に記したもので、技術好きにはたまらない内容でした。しかも単なる「できました」報告ではなく、どうやって出力しやすい形に寄せたのか、何が難しかったのかまで触れています。こういう話は、派手さはなくても妙に後を引きます。きっかけは、crysta.ai の Teng Xu さんが「昆虫の作品を印刷しませんか」と声をかけたこと Gaussian Splat は、そのままだと“視点によって色が変わる”ので、印刷向けに調整が必要だった著者は spherical harmonics を level 0 で学習し、linear space でも扱った出力では、Gaussian Splat を voxel化してから、特殊な3Dプリンターで層ごとに印刷する仕上がりは「現代版の琥珀みたい」と表現されるほど印象的ただし、色味が少し暗く茶色っぽいことや、fur の表現がまだ難しいことも率直に書かれている crysta.ai はまだ開発途中で、編集ツールや voxel

papoo.work

JDK 28 にやってくる Valhalla、10年越しの「速さ」と「わかりやすさ」の折り合い

Javaの世界で長年ほぼ伝説扱いだった Project Valhalla が、ついに JDK 28 に入ってくる見通しになりました。元記事は、このニュースを起点に「そもそも Valhalla って何なのか」「なぜこんなに時間がかかったのか」「JDK 28 で本当に何が入るのか」を、かなり丁寧にたどっています。個人的に面白いと思ったのは、Valhalla が単なる“高速化プロジェクト”ではないことです。もっと本質的には、Java の書きやすさと機械にとっての扱いやすさが、ずっとズレたままだったのを何とか揃えようとしている話なんですね。ここ、地味だけどかなり大きい。 Valhalla は、「クラスの書き心地」と「primitive のような効率」を両立させるための長期プロジェクト JDK 28 には JEP 401: Value Classes and Objects が入る見込みただしこれは preview で、しかも最初の一歩 にすぎない重要なのは、Java のオブジェクトが抱える 間接参照・メモリのばらつき・GC負荷 を減

papoo.work

Bunny DNSが無料化、しかも「クエリ課金」をやめたのがかなり大きい

bunny.netが、Bunny DNSのDNSクエリ課金を完全に撤廃しました。ざっくり言うと、DNSの問い合わせ回数に応じて料金が増える仕組みをやめた、という話です。しかも「無料化」と言っても、ただの宣伝文句ではなく、クエリ数の上限なし・リクエスト単位の課金なしまで踏み込んでいます。 DNSは普段あまり意識しない仕組みですが、Webサイトやアプリにとってはかなり重要です。住所録みたいなもの、と説明されることが多いですが、bunny.netのDNSはそれよりずっと賢い。単に名前をIPアドレスに変換するだけではなく、遅延や稼働状況を見て、どこに通信を振るかまで決められる“ルーティングエンジン”寄りのDNSです。ここがこの発表の面白いところだと思います。 bunny.netは、Bunny DNSについて次のような変更を発表しました。 DNSのクエリ課金を廃止 DNS hostingは1アカウントあたり500ドメインまで無料 クエリ数の上限なし 1リクエストごとの課金なし smart records や health monitoring も

papoo.work

Anthropicの新モデル「Mythos」は本当にバグを見つけられるのか

AnthropicのAIモデル「Mythos」を、独立系の開発者コミュニティが“セキュリティバグ探し”で試している、というのが今回の話です。元記事のテーマはかなり率直で、「このモデルは脆弱性を見つける力が本当にあるのか？」を、机上の宣伝ではなく実戦寄りのベンチマークで確かめようとしている、というものです。 AIの話はすぐに盛られがちですが、セキュリティの世界はそんなに甘くありません。バグを見つけるのは、ただコードを読むだけではなく、「ここ、妙に危ないな」と違和感を拾う作業でもある。だからこそ、Mythosのようなモデルがどこまで通用するかは、かなり面白い試金石だと思います。独立系の開発者コミュニティが、AnthropicのMythosを脆弱性検出で検証している目的は「AIがセキュリティバグを見つけられる」という主張の実力確認ベンチマークは、宣伝文句ではなく実際の検出能力を見るためのもの AIがコードレビューやデバッグを助ける可能性はあるが、過信は禁物セキュリティ領域では、AIの“それっぽさ”より再現性と正確さが重要になる元記事のタイトルは少し遊び心があります。`Will it

papoo.work

物理のゆらぎで画像を描く「Un-0」がかなり野心的だった

Unconventional AIが公開した Un-0 は、coupled oscillators（結合した振動子） のシミュレーションで画像を生成するモデル画像生成の土台に、ふつうのニューラルネットではなく 物理っぽい動きそのもの を使おうとしているのが最大の特徴 ImageNet 64×64 では FID 6.74 を達成し、公開時点の評価でかなり強い水準に入っているモデルの weights、training code、ablation code が公開されていて、試しやすいただし、学習にはまだ普通のGPUと大きな計算量が必要で、「省エネ革命がもう完成した」という話ではないこの記事でいちばん引っかかるのは、画像生成器の中身です。 Un-0 は Transformer や diffusion の延長線上にあるのではなく、振動子が互いに影響し合う物理システム を計算の本体にしています。振動子というのは、たとえばメトロノームみたいなものだと思うとわかりやすいです。1個なら勝手に一定のリズムで動くだけですが、2個、3個と並べて同じ台

papoo.work

IBMが“1nm未満”に踏み込んだ。半導体の限界を押し広げる新チップ技術

IBMがまたやりました。 2026年6月、同社は世界初という「sub-1 nanometer（1nm未満）」のチップ技術を発表しました。正確には、0.7nm、つまり7 angstromノードのトランジスタ構造を使った技術です。ここで大事なのは、単に「もっと細かく刻めました」という話ではないことです。半導体はずっと、小さくして速く、安く、省電力にする方向で進化してきました。でも、その延長線上でそろそろ限界が見え始めていた。今回の発表は、その限界に対して「まだ別の道がある」と示したようなものだと思います。 IBMが世界初のsub-1nmチップ技術を発表した 0.7nm、または7 angstromノードのトランジスタ構造を採用新しい3D構造「nanostack」で、トランジスタを縦方向に積み上げる 2nm世代と比べて、最大50%の性能向上か、70%の省電力化が見込まれる生成AI、クラウド、次世代デバイス向けの計算能力を押し上げる可能性がある量産は早ければ今後5年以内という見通し半導体の世界では、nm（ナノメートル）はとにかく小さい。1nmは100万分の1mmです。髪の毛より何万倍も

papoo.work

AIアシスタントは本当にだませるのか？ 2,000人が挑んだ“ハック実験”の結果

2,000人以上が参加し、6,000通超のメールでAIアシスタントを攻撃した目的は、`secrets.env` という秘密情報ファイルの中身を漏らさせること結果は、一度も漏えいなし。無断返信も成功しなかったただし、実験中にGoogleのメールアカウント停止やAPI料金の増加など、運用面のトラブルはかなり起きた著者は、AIエージェントに強い権限を持たせるのはまだ危ない、と考えているそれでも、思っていたより prompt injection（指示のすり替え攻撃）に強かった、というのがこの実験の意外な結論 Fernando Irarrázavalさんが公開したのは、かなり実地っぽいセキュリティ実験です。自作のAIアシスタント「Fiu」に、誰でもメールを送りつけられるようにして、なんとか秘密情報を吐かせようとする。いわば「AI相手の公開耐久テスト」ですね。狙われたのは `secrets.env` の中身です。`.env` 系のファイルは、アプリのAPIキーやパスワードなどを入れることが多いので、漏れたら普通にまずい。そこをAIに読ませ、しかもメール返信機能まで使わせて、だ

papoo.work

中国が「発電所とデータセンターを直結」したい理由

中国は、データセンターの電力を公共電力網まかせにせず、太陽光や風力から直接送る仕組みを広げようとしているその実験場になっているのが、寧夏（Ningxia）・中衛（Zhongwei）の砂漠地帯にある新しいプロジェクト 4本の専用送電線で、太陽光発電とデータセンターをつないでいるのが特徴背景には、AIの普及でデータセンターの電力需要が急増している事情があるただし、再生可能エネルギーは天候に左右されるので、理想通りにいくかはまだ未知数中国のデータセンター政策、かなり攻めています。 TNWの記事が取り上げているのは、北京が「グリーン電力をデータセンターに直接つなぎたい」と本気で考えている、という話です。正直、これはただの環境アピールではありません。AIブームで電力消費が跳ね上がるなか、今のままでは電力網が先に悲鳴を上げる。だから、発想そのものを変えにいっているわけです。記事の舞台は、中国北西部の寧夏回族自治区、中衛市の郊外。砂漠の中に並ぶ太陽光パネルから、データセンター群へ専用の送電線を引く。しかも、その電気は公共の送電網を通らない。ここが肝です。ふつうは発電した電気がいったん電力網

papoo.work