メインコンテンツまでスキップ

「AI」タグの記事が37件件あります

AI tag description

全てのタグを見る

Qwen3-Coder-30bがやばすぎる

· 約2分
もみじーな
個人開発者

Qwen3 CoderがついにでてLM Studioでも30bが使えるようになっていたので試したのですがやばすぎます。

作成してもらったウェブサイトを張っておきますが商用利用可能なフリー画像素材も学習データに入れたようでほぼ完璧なサイトが以下のプロンプトだけで作成できました。
(以前もありましたが画像がきれいに入ることはあまりなかったです。)

作成してもらったウェブサイト ※しかも一発生成です。

HTML, CSS, JSを使用して、2025年9月に開催される『Tech Innovation Summit』のウェブサイトを作成してください。イベント概要、スケジュール、講演者紹介、チケット購入ページを含み、モダンで革新的なデザインにし、カウントダウンタイマーも実装してください。

そしてこちらをご覧ください。

RTX 5090を使いQwen3-Coder-30bで120 token/sでています。

gemma3 27bは60 token/s程度です。 一応、比較用画像

すごい速度で生成されたので驚きました。
さらにQwen3 Coderは日本語対応なので神です。

Qwen4は一体どうなるのか・・・

そういえばLM Studio用に6月に作成したPCのスペック写真を貼ってなかったので下にry

時間があれば6950XTでどれくらいの速度がでるか試してみます。(一応、5090を1とした場合のメモリ帯域速度から予測はできますが最適化などの差を含みます。)

あ、最後に話が変わりますがRadeon AI Pro R9700は20万前後くらいになりそうですね。

Intel Arc Pro B60の値段しだいですが年末か来年あたりどちらかを4枚買ってさらにオクタチャネル対応マザーを試してみるかもしれません。

購入するAI用のPCを考える②

· 約4分
もみじーな
個人開発者

このブログの内容は半分以上メモです書いている日もバラバラでなんの検証もしてないのでオクタチャンネルへの希望を持つことは推奨しません。

RTX5090で結構満足しているがやっぱり70B動かしたいなと考え年内または来年購入するPCを考えます。

7900xtxを2枚買って48GBを考えていたがそもそも通常マザーボードに7900xtxの2.5スロット厚を2枚はライザーでも使わないとささらないです。

PCケースに収めたいのでライザーは候補から外します。

とりあえず7900xtxはEATXならささるかもしれないけど買ってささらなかったら悲しいので 年末ごろEATXマザーボードを買ってから考えようかなASUSの画像的にはささりそうだけど

Intel Arc Pro B60 Dual 48Gもなんと一般販売はないだろうと言われました。
(代理店とか通すと2倍,3倍はします。買うならサーバーセットですかね)

そこでWindows PCでどれだけMac Studio 512GB(1,493,800円)に近づけるかで考えたのが適当なIntelのGPUと ASUS PRO WS W790E-SAGE SEというオクタチャンネル動作が可能なマザーボードを使うことである。

メモリ速度が早ければ共有GPUメモリを割り当てられてもボトルネックが少ないはずなので(要検証)

まずこのオクタチャンネルを使うにあたりDDR5という条件が必須である。

DDR4 でもCPUが2スロットあるものであればクアッドチャンネルx2で実質オクタチャンネル(違うかもしれない)

ですがddr4 だと帯域幅に結構差が付きます。


DDR5-4800 (4800 MT/s) の場合:(64GB*8枚とします)

メモリ帯域幅=(4800/1000)×8×8(チャンネル) =4.8×8×8 GB/s =307.2 GB/s


DDR5-4800を使う理由は64GBメモリがこのクロック数より上だと24GBしかないんですよね・・・

※もしメモリ容量を妥協できるなら速度は以下です DDR5-6800 (6800MT/s) の場合:435 GB/s

DDR4だと安いけど以下みたいな感じかなおそらくもう中古になるのと Dual CPUになりますが

メモリ帯域幅 = (2400/1000)×8×8(チャンネル) = 2.4 × 8 × 8 = 153.6GB/s

153GB/sでも確かに十分早いのですがユニファイドメモリにはやっぱり負けますねこれならRyzen™ AI Max+ 395とかのほうが消費電力的にもいいですね。

以上からASUS PRO WS W790E-SAGE SEにIntel Arc Pro B60 24GBも4枚ぎりつめそうなので96GB+DDR5 オクタチャンネルによる共有GPUが半分乗せれるので200GBクラスがいけるかも?ということです。

あとは7月にでるはずのRadeon AI PRO R9700が20万以下なら候補かも・・・

Intel Arc Pro B60を複数枚買うにしろRadeon AI PRO R9700を複数買うにしろ帯域は450~640GB/sなので共有GPUとしてオクタチャンネルメモリで割り当てればボトルネックが抑えられる気がしますが 検証動画がみつからないので誰か試してください・・・(CPUとGPU間でボトルネックがでるかもそれでもある程度は抑えられるはず)

Mac Studio 512GBは高いわりに推論以外やることがほかのある程度のPCでできるの買いたくはないです。
(8K動画編集しない人は何に使っているのか気になります・・・なにかしらのシミュレーションとか?)

RTX PRO 6000は結局複数買わないと70B動かして喜ぶかしかできないです。
(Nvidiaならファインチューニングとかに使えるのでありだとは思います。値段以外)

結論は推論目的ならAPIをレンタルしたほうが安上がりかもです。

私はそれでもローカル構築を目指しますが・・・

PCデータ移行中です。

· 約1分
もみじーな
個人開発者

現在、AI用にPCを買い換えた為、まだデータ移行中です。

6950xtからRTX5090に変えましたけどやっぱり違いを感じます。

あと7900xtxがやっぱり安くなってきてます。

秋頃に在庫があれば2枚購入してDeepSeekの70bを試してみたいです。

7900xtxが2枚ならぎり70bが動きます。

コンテキスト長をのばすと使えないですけど・・・・

とりあえずPC購入

· 約1分
もみじーな
個人開発者

AI用のPCを考えるから早いですかとりあえず全てのパーツの購入が完了しました。

GPUはRTX5090を購入しました。

今回、購入の決め手はPC工房で先週の土日に5090が30万円代で販売していたからです。

若干、RTX PRO 6000を購入しておけばよかったのではないかと後悔はありますが
5090で足りないと感じたら来年考えます。

あとは7900xtxが6950xtの時のように10万切ったら買いますがこれは趣味です。

現在、マザーボードだけなぜか来週の土曜日に来るので組み立てはそれ待ちですが Qwen3 32bがどれくらいの速度で動くのか楽しみです。

ついでなのでOpenManusもQwen3 32bでどれくらい早く正確かためしてみます。

購入するAI用のPCを考える

· 約1分
もみじーな
個人開発者

AI用にPCを購入予定ですがとりあえず自作することにしました。

Core Ultra 7が値下げしたのでCPUはこれに決まりですかね。

NPU使って見たいですしね。

Ultra7でPCを組んでGPUは決めますがRTX5090が現状の候補です。
ひさしぶりにCUDAも触りたいですしね。

IntelからもAIようにArc Pro B60がでるみたいですがメモリ帯域は微妙でした。
消費電力はいい感じです。

48GB版が1000ドルくらいなら開発用に1枚買う予定です。

理由はIntelのCUDA互換をテストするためですがいくらかな。

とりあえずGPUなしで組んだらまた報告します。

GPUのトークン生成比較シミュレーター

· 約2分
もみじーな
個人開発者

GPUを購入するにあたり何を買うか決める為にGPUごとにトークン生成速度を計測するための シミュレーターを作成してみました。

GPUだったりモデルだったりの情報はまとめるのがめんどくさかったのでGemini Deep Researchで 取得してみました。

なのであってるかは謎ですかがまぁ目安としてはよさそう?

下の画像はQwen3 14B (Q4_K_M)を使用する場合のシミュレーション結果です。

これが私の6950xtでのLM Studioの結果です。

誤差はあるけど似た感じなので目安です。

このシミュレーション結果的にはAMD MI300Xが最強ですがいくらだよ。

NVIDIA RTX PRO 6000 はメモリが多い5090って感じ。

年末まで考えよ・・・・

MAC買うなら5090買いたいので円高になってくれ

シミュレーターも正確か不明だけどなんとなくアップロードしておきます。

シミュレーション設定のところは途中であきらめたのでデフォルト推奨(おそらくバグあり)

デフォルトしかバグの確認してません。

シミュレーターです。

LM Studio用のGPUを買い換えたい

· 約1分
もみじーな
個人開発者

現在,ローカルAIを実行するためにRadeon RX 6950 XT
というGPUを使用しているがメモリが16GBだと足りない。

gemma-3-12b-itでも別作業しながらでも40 tok/secぐらいはでるが
トークン量を増やすとすぐに16GBだとおさまらなくなる・・・

RX9070は16GBなので7900XTを購入するかRTX5090の在庫の復活を待って
値段が安定して40万きったらほしいかな。

NVIDIA RTX PRO 6000 Blackwell Workstation Editionはさすがに高すぎるけど
動画生成AIで1分の動画が高速で作れるとかなら考えるけどどうなんだろ。

他はNvidiaからProject DIGITSというAI用のPCがでるみたいだけどメモリ帯域が
273GB/sと聞いてがっかりしてます。

一応、発売まで待って考える予定ですがMacの96GBもとりあえず候補にしようかな

Project DIGITSが実はMacより早いとかであれば即購入ですかね。早く発売しないかな。