電脳遊戯の嵐

PC、ゲーム、自転車を中心にぼちぼち書いていきます。
保証対象外となる作業については自己責任で。

2017年04月

TURBO-GTX1060-6GでTMPGEnc高速化

よく調べたら少し前のものになるけど、ASCII.jpで比較してた。
やっぱり良いカードになるほど速いのな。

前回TMPGEncを高速化するためにTURBO-GTX1060-6Gを買った。

今回は亜人ちゃんは語りたいでエンコードのテストをしますぞ。
エンコードを少し重くしたいので、フィルターはインターレース解除とノイズ除去(時間軸)の2つ。

ということでそれぞれでエンコードした結果。
encode3_CUDA
GTX1060はえー!
なし→GTX750Tiで279秒短縮。
なし→GTX1060で839秒短縮。
GTX1060でGTX750Tiの約3倍短縮。
ほぼ仮想FLOPS通り?
これってGTX1070にしたら4.5倍短縮できたってことかしら?
750Tiの4.5倍だと1255秒になるからエンコード時間が975秒……になるかどうか分からないから誰か貸して!(ぉ

折角速くなったので高精度ノイズ除去を使ってみる。
encode3_filter
重杉内。
でも暗いシーンで気になるノイズは高精度ノイズ除去の方がキレイになるのよね。
高精度ノイズ除去はCUDAなしではおそらくやる気にならないけど、GTX1060なら何とか我慢できるレベルかな〜
今後は高精度ノイズ除去を追加していく感じで。
CPUは舐めプしてるのでボトルネックはフィルターにある模様。

ASUS TURBO-GTX1060-6G

今使ってるビデオカードは2年半前に買ったZOTACのGTX750TiなんだけどTMPGEncはあまりフィルターを使わなくても結構な頻度でCUDAを使うから高速化できないものかと考えた。
高速化したらフィルター使ってもいいかな。
でも調べてもそんな用途で比較してるような人いない……

まぁ、理論上速くはなるはずということでスペック比較。

CUDAコア数
(基)
クロック周波数
(MHz)
仮想FLOPS 性能比
(750Ti=100)
GTX750Ti 640 1085 694400 100%
GTX1050Ti 768 1392 1069056 154%
GTX1060(3GB) 1152 1708 1967616 283%
GTX1060(6GB) 1280 1708 2186240 315%
GTX1070 1920 1683 3231360 465%
性能だけ見ればGTX 1070が圧倒的ですな。
GTX 1080以上は値段的に予選落ちw

性能を見たところで、それぞれの値段を価格.comで見てみるよ。
Geforce GTX 1050Ti
Geforce GTX 1060(3GB)
Geforce GTX 1060(6GB)
Geforce GTX 1070
GTX1050Tiは15kからで性能は約1.5倍。
GTX1060は3GBだと22kからで性能が3倍弱。6GBだと28kからで性能が3倍強。
GTX1070になると43kからで4.5倍強。
値段的にGTX1070になると敷居が上がる感じ。
ということでGTX1060の3GBが良いけど、外排気のクーラーがないのよね。
M-ATXのケースでグラボの熱が篭もると一気にケース内温度が上がりそうだし、グラボの真下にM.2スロットがあるから熱風を当てたくない。
数年使うだろうしってことで少々高かったけどASUSのTURBO-GTX1060-6Gを購入。
gtx1060_1
このクラスのビデオカードは買ったことなかった気がする。箱がデカい。

カード自体もデカい。
gtx1060_2
存在感ぱねぇ。

マザーボードが戯画でビデオカードがASUSって妙な感じ。
実際のTMPGEncでの測定はまた今度。

仮想サーバー組立編

Ryzenを買ってCore i7 6800K一式が浮いてしまったので、普通に使う分には有り余るメモリーとCPUパワーを生かしてやろうって魂胆。

という訳で家にあるパーツをかき集めてくる。
ビデオカードは映るだけでいいんだけど、Matrox G450が中古で買ったのまだあるよ!
……AGPだから余裕で使えないね。
PCI-Expressで1スロットで転がってるものとなるとRadeon HD 3870?
……要給電やん。消費電力大きくない?大丈夫?

という訳で何故かQuadro FX1700を2000円で買ってきた。
Quadroだぜ!OpenGLに特化してるぜ!(関係ないけど

マザーボード:X99-M WS/SE
ビデオカード:Quadro FX1700
ディスク:家にあるヤツ
RAIDカード:Areca ARC-1680i
キャプチャーカード:EarthSoft PT2*2

久々にARC-1680iが使うで!
 →ARC-1680iのファームウェアが起動しない。

エッ(゚Д゚≡゚Д゚)マジ?

試しにキャプチャーマシンに使っていたZ68MA-ED55に挿して動かしてみると起動する。

これは!
もしかしてUEFIに対応していないという話だろうか。

しょうがないからZ68MA-ED55を使うことにするか……
Sandy Bridgeに逆戻りだけど……
メモリーが12GBじゃ心もとないので、NASに装着した16GBを召し上げることにする。
NASのメモリーを16GB→8GBに交換。

交換後にNASを起動したらネットワークから参照できなくなる。

エッ(゚Д゚≡゚Д゚)マジ?

NASの液晶パネルを見る限り特に問題は起きてなさそう。
L2スイッチを確認したらポートはLink UpしてるけどリンクアグリゲーションがLink Downのまま。
NASを再起動を2〜3回してみたけど状況は変わらず。
試しにLANケーブルを交換したら繋がった。

何という単純なミス……

外す前までは問題のなかったケーブルが、配線のやり直しで変になった模様。
もうこのケーブルは捨ててCat6aのケーブルを補充しておくか……

ようやくZ68MA-ED55で組み替えて起動したらこちらでファームウェアが起動しない。

工工工エエエエエエェェェェェェ(゚Д゚)ェェェェェェエエエエエエ工工工

さっき動いていたやん。挙動変わりすぎじゃね?
Sandy Bridgeに戻した意味ないやん。
しかし動かないものはしょうがないので転がってたACS-61100-12を付けたら問題なく起動。

ACS-61100-12は出来る子。

VMware vSphere Hypervisorをインストールしたらハードウェア上は認識してるのでARC-1680iはお払い箱か?
CoreDuo T2400のマシンで動かしたら大丈夫かなw

というのが先週末やっていた話。

しかしACS-61100-12ってUEFIに対応してるならX99-M WS/SEでも起動するんじゃね?と思ったけどどうしたか記憶がないので、週明けに試したら普通に動いた。
ARC-1680iにこだわり過ぎたか……

という訳でめでたくCore i7 6800Kの有効利用先が決定。
1年ぶりにStacker復活……予定。
vsphere1
vsphere2
HDDが16台載るなんて胸熱だな。

Gigabyte GA-AB350M-Gaming3

マザーボードの話を書くなんていつ以来だろう。

うちのメインマシンは2年前からMicroATXにしているので、Ryzenにする時も必然的にMicroATXのマザーになる。以前書いたけど、候補は4つだった。

BIOSTAR B350GT3 Ver. 6.x
MSI B350M MORTAR
GIGABYTE GA-AB350M-Gaming 3
ASRock AB350M Pro4

こういう時でもないと選択肢に挙がらないBiostarにするか、Ryzenで安定してるMSIにするか、老舗の戯画にするか、スペック的に一番良さそうな変態にするか。
なお、各板の状況(3/11当時)

Biostar:売り切れ
MSI:発売前
変態:発売前
戯画:パソコン工房 秋葉原BUYMOREに在庫有り

ということでGA-AB350M-Gaming3を買ってきた。

AB350MG3ALL
Gigabyteと言えば青基板ってイメージだったんだけど、最近流行りの赤黒すな。

電源回り
4+3の7フェーズ
CPU側が4フェーズでヒートシンクが付いてる。
VRM1

SoC側は3フェーズ。
VRM2

エンコード中でCPUを全力運転するとCPU側のVRMがモニターソフト読みで90度になるけどね。
CPU側のフェーズはもうちょっと多い方がいいなぁ。
M-ATXのROGとか出ないかな。

拡張スロット
PCI-Express
x16(3.0)
空き(M.2スロット)
x1(2.0)
x16形状の4x(2.0)

Gamingという名前が付いているだけあってビデオカードに配慮した配置。
その割にはM.2スロットがx16の下にあるから、ビデオカードがフル稼働したら熱風が当たるけどね。
発熱量の多いビデオカードを使ったら気になるなぁ。

16xにビデオカード。
1xにキャプチャカード。
4xにLANカード(将来的には10Gbカード)

という使い方をする。
それにしてもIntensityが未だに現役とはw

M.2スロット
type2242〜22110まで対応。
GA-AB350M-Gaming3に挿したPX-512M8PeG-08にOSをインストールしてX99-M WS/SEに差し替えても起動したけど、X99-M WS/SEからGA-AB350M-Gaming3に戻したらWindowsがBSODで起動しないの。
初期化しようとしたら……
BSOD
なんでやねんw
またOSの再インストールからだよ!
そういえばF3cのBIOSにアップデートした時にもM.2スロットのSSDから起動しなくなったな。
F2に戻したら起動したけど。
これってもしかしてBIOSアップデートする度にOS再インストールさせられるフラグ?
と思って清水の舞台から飛び降りる覚悟でF3cにしたら問題なく起動した。
PX-512M8PeG-08のファームウェアをバージョンアップしたからかな?
またしても原因は闇の中!(死

関係ないけど、そのままディスクをフォーマットせずに再インストールしたらユーザーフォルダがWindows.oldの中に移動しててWindows賢くなったんだなと感心した。

SATAポート
ASATA3 0, 1、SATA3 0〜3の6ポートとB350にしては頑張ってる数。
SATA
なお、M.2スロットの使用状況で排他となるSATAポートが変わる。
PCIe x4のものを接続した時はASATA3 0, 1が使用不能、SATAのものを接続した時はSATA3 3が使用不能になる。
PCIe x2のものを接続した時と使用していない時は全てのポートが使える。
マニュアルにも記述されているよ。

ちなみにシリアルポート2つとパラレルポートのピンヘッダが用意されているよ。
すっごーい、レガシーなフレンズにも優しいマザーボードなんだね!

UEFI
オーバークロックは出来るけど、必要最低限って感じ。
バージョンがF2の時点ではBCLKは設定不可なのでCPUは0.25倍刻みでの倍率変更のみ。
メモリは1333、1600、1933、2133、2400、2666、2933、3200と設定可能(1333に設定したら動かなかったけど)

CPU倍率とメモリークロックの最小値。
BIOS1

最高値。
BIOS2

仮想化支援のSVMをサポートしてるらしいけど、オンにしてVirtual BOXを起動したらゲストOSが立ち上がらなかった。
電圧はCPUのVcoreとVCORE SOCがAutoとNormalと電圧のオフセット量が設定可能。
AutoとNormalの違いが分からない。
メモリーはDRAM VoltageでAutoとNormalと電圧を入力して設定可能。

電圧の最低値。
BIOS3

電圧の最高値
BIOS4
流石に最高値は空冷では壊れそう。

メモリータイミングはAuto、Manual、Advanced Manualが選べて、ManualでtRCDRD、tRCDWRを設定可能。Advanced ManualでManualに加えてCAS Latency、tRP、rRASが設定可能。
倍率等の上げ下げの操作はキーボードの+と−を使うんだけど、キーボード配列がUS扱いなのでテンキーレスだと+がShift+^になっていて、最初設定が弄れないものだと思ってしまった。

特に使っていて致命的な不具合がないのは流石Gigabyteといったところだけど、4月の中旬になろうかという時期になってもBIOS更新が放置されていて未だにF2なのは困ったところである。
怪しげなルートでβBIOSが配布されていたのを入れてしまうぐらいウズウズする。
4月中にBIOSがリリースされなかったらASRockのM-ATXマザーにしようかなぁ……

RyzenでTMPGEnc追試【更新しました】

(4/7:グラフが見づらかったのとAVXの検証する比較対象データが不適切だったので修正しました)

手持ちのメモリーだとRyzen君の性能がうまく引き出せないので一旦メインマシンを6800Kに戻して、しばらくメモリーを入れ替えて検証し直すことにした。

RyzenはメモリーコントローラーのクロックとInfinity Fabricが同期してるのでメモリークロックを上げると性能が底上げされるというアグレッシブな仕様なので、メモリーをOCタイプのにすることにする。
値段との兼ね合いでCORSAIRのVENGEANCE LPXにした。
型番はAmazonで比較的安かったCMK16GX4M2A2666C16。
XMPを有効にしたら普通に2666で動いた。
memory_setting2
やるなCORSAIR。

ただ、OCして再起動すると一度完全にオフになった後で2133で起動してくる。
一度2400にしてしばらく使ってから再起動して2666に設定すると立ち上がってくるから挙動がよく分からない。
GA-AB350M-Gaming3の癖なのかねぇ?
BIOSアップデートで改善されれば良いのだけど。
改善されないようなら別のM/Bも考えるかなぁ。
とりあえず消えたβBIOSを突っ込んでメモリー電圧を盛ったら起動するようになったので判断保留。
AsrockのAB350M Pro4が次の候補かなー

まぁ、それはともかくとして家の部品をかき集めてマシン作った。
しばらくこれで検証するけど、Zippyの電源うるせぇw
OSは一時的なものなのでWindows10の評価版を入れた。

またTMPGEncで比較するのでTVMW6の評価版を両方に入れてテスト。
CUDAが有効になるような局面でどう変わるのかは、Geforceがメインマシンのみでビデオカードを入れ替えないといけないので未実施

ソース1
けものフレンズ「ゆきやまちほー」
ゆきやまちほー書きかったちゃうんかと。
その通りです(殴
encode_filter_source1
インターレース解除のみ。
CUDAを有効にしててもCPUだけでエンコードが完結する。

ソース2
このすば2期「この素晴らしい仲間たちに祝福を!」
キレたウィズ強すぎない?(そうじゃない
encode_filter_source2
インターレース解除と左右のクロップ。
CUDAを有効にしているとCUDAが仕事をする。
(今回はCUDA無効)

まずはRyzenでメモリー速度を変えてエンコード速度が変わるかどうかを確認。
Ryzen 7 1700の定格のエンコード中のクロックは3.2GHzだった。
ちなみにグラフの単位は全部秒です。

ソース1
encode1_memoryspeed
全体的にTVMW5の時より普通に速いんだけど。
メニーコアに最適化されたんかね?
64bitアプリケーションだからかね?
というかメモリーが1RANKだと速くなるの?
原因はよく分からないけどRyzen君が覚醒した!
メモリー速度がDDR2133→DDR2666で3%程度速くなった。

ソース2
encode2_memoryspeed
こっちはDDR2133→DDR2666で2%程度だけどエンコード時間が長いので短縮した時間は長い。
このソースだと測定ミスを疑うほど圧倒的にCore i7が速いね。

DDR2666でAVX、AVX2を無効にして、マルディプレクスバッファサイズの設定を変更。
ソース1
encode1_avx
無効にしたら3%速くなってCore i7より速くなった。
AVXが苦手なのは本当なのね。

ソース2
encode2_avx
こちらは7%速くなったけどCore i7には遠く及びませんな。

今度はメモリーを2666で動かしたままOCしてみるよ。
ソース1
encode_oc1
3.6GHzが最速になってそれ以上OCすると遅くなっていく……
これは動いているけど不安定だと思った方が良いね。

ソース2
encode_oc2
3.7GHzが抜けてるのは気にするな!
こちらはクロック通りに上がっていくねぇ。
ソース1はミスったのか頭打ちになってたのか。

結論
メモリーは1Rankがいいぞ!
メモリークロックは速い方がエンコードも誤差範囲レベルではあるものの確実に速くなる。
CPUクロックはオーバークロックした方が速くなるけど、適度に喝入れをしないと逆に遅くなるケースもある。
AVX, AVX2は両方無効にした方が速くなる。
基本性能のゴリ押しで命令系の不利はひっくり返せる局面もある。
ひっくり返らない部分はCUDAが使われる場面だと思われるので、CUDAを有効活用すると逆転しないまでも差が縮まると思われる。
今度はCUDAを使った時の検証するか。
アクセスカウンター

最新コメント
  • ライブドアブログ