記事一覧

2026-07-17

なぜ微調整された専門特化型AIが、いま実務ではじめて汎用AIを打ち負かすようになったのか

Bridgewater事例：狭域が広域を上回る場合過去2年間、AI産業は単一の戦略を追求してきた：すべてを処理できるより大規模なモデルを構築することである。しかしThinking...

Technology1 min read

2026-07-16

レート表による比較が30%のトークン効率の差異を隠している理由：2026年7月のモデルで真の「タスク当たりコスト」を計算する方法

あなたの財務チームが信じているレート表の嘘あなたはトークンに対して料金を支払っているのではありません。答えに対して料金を支払っているのです。この違いが、予算内に収まるチームと9月...

Technology2 min read

2026-07-15

Claudeのハイブリッド推論における速度と精度のトレードオフ：テスト時コンピュート予算の実際の仕組み

長く考えることの実際の経済性 Claudeのハイブリッド推論アーキテクチャは、研究者が「テスト時コンピュート」と呼ぶもの—つまり、トレーニング中ではなく推論中に計算リソースを配分す...

Technology1 min read

2026-07-14

Claude コンピュータ使用とプロンプトインジェクション耐性：すべてのデプロイメントに必要な本番安全パターン

コンピュータ使用モデルが本番環境で稼働中。プロンプトインジェクション耐性が、実際に実行できるかどうかを決定する。 Anthropicは2026年3月23日にClaudeのコンピュー...

Technology1 min read

2026-07-13

Liquid AIの「Antidoom」が推論モデルの崩壊率を23%から1%に削減—小規模AIシステムの信頼性エンジニアリングが示すもの

問題：推論モデルにおける「破滅ループ」 Liquid AIは「Antidoom」というオープンソース手法をリリースしました。これは推論モデルが「破滅ループ」に陥るのを防ぐためのもの...

Technology1 min read

2026-07-12

構造化出力戦争：Claude、GPT、Geminiの実装がなぜ異なるのか—本番環境での構築方法

コアの問題：LLM出力は対話的ではなく、決定的である必要がある LLMに検証済みJSONを返させる必要があります。スキーマを渡します。一貫性を期待します。しかし、各主要プロバイダー...

Technology1 min read

2026-07-11

あなたの128Kコンテキストウィンドウが実は128Kではない理由：中間喪失問題と実際に使える容量を測定する方法

広告上の容量と実際に使用可能な容量のギャップは、多くのチームが認識するより大きい言語モデルベンダーは128,000トークンを謳っていますが、実際に得られるもの—モデルが確実に使用...

Technology1 min read

2026-07-10

広告されるコンテキストウィンドウサイズが誤解を招く理由：Claude、GPT、Geminiにおける検索精度を大規模で測定

マーケティングの物語とベンチマークの現実ベンダーが最新のLLM機能を発表する際、コンテキストウィンドウサイズは最初に取り上げられます。GPT-5.5とGemini 3.1 Pro...

Technology1 min read

2026-07-09

3週間の先例：Claude Fable 5の禁止がAI安全保障ガバナンスの新しい基準をどのように創出したか

モデルのジェイルブレイクが国家安全保障上の出来事となる時、すべてが変わる Claude Fable 5は公開製品として3日間しか存在せず、米国商務省が2026年6月12日にインター...

Technology1 min read

2026-07-05

Claude Opus 4.7の高解像度ビジョンモード：98.5% XBOW精度がコンピュータ使用の本番運用対応を変える仕組み

具体的な機能 Claude Opus 4.7は2026年4月16日にローンチされ、それに伴いClaudeのコンピュータ使用機能が画面上のコンテンツをどのように認識するかに対する文書...

Technology1 min read

2026-07-05

Claude コンピュータ使用: API サンドボックス vs. Cowork デスクトップ—ブラウザ自動化の実行環境を選択する

これは「AI の自律性」についてではありません。適切な実行境界を選択することです。 Anthropic のサンドボックスは許可プロンプトを 84% 削減します—これは勝利のように聞...

Technology2 min read

2026-07-04

LoRAがタスク性能を損なわずに90%の計算量削減を実現する理由：パラメータ効率的ファインチューニングのトレードオフを理解する

効率性の主張は本当だ。ただし、実行はより複雑である。 LoRA（Low-Rank Adaptation）は確かに価値あるものをもたらす：メモリ要件を約10～20倍削減しながら、大規...

Technology1 min read

1 / 4Next →