Meriken's Tripcode Generator

64a6d620 anonymous 2016-04-16 07:23
新バージョン乙です

HD6670+Win7SP1 64bit+Catalyst15.7.1のPCで2.1.0FEを動かしてみたのですが
ローカルでの診断でもYggdrasilに接続しての検索でも
10桁をGPU検索しようとするといつまで経っても0MTPSのままでGPU検索ができません
(GPU使用率が0のままでGPUクロックもアイドル状態のまま変化しません)
あと12桁も数回診断した平均値で2.0.6FEに比べて少し(5%程度)速度が落ちてしまっているようです

タスクマネージャでプロセスを見ていると
2.0.6FEや2.1.0FEでも12桁の場合は検索中にMerikensTripcodeEngine64.exeが3個起動していて
1個がCPU検索用?で2個がGPU検索用?に動いているような感じですが
2.1.0FEの10桁の場合はGPU検索用?のMerikensTripcodeEngine64.exeが
起動して数秒後に消えて1分後くらいにまた起動して…を繰り返しているように見えます

ちなみに[詳細設定]で2.1.0FEから新設の[GCNアセンブラを使用する]のチェックを切り替えて試してみたり
その他の設定(ワークアイテム数/プロセス数/スレッド数/優先度など)も思いつく限り変えて試してみましたが
今のところどうやってもHD6670+2.1.0FEで10桁のGPU検索ができない状態です

今回の新バージョンはGCN Radeonへの対応がメインと思いますし
VLIW Radeonは専用のベータ版Crimsonドライバを入れるとWindowsからOpenCLデバイスとして認識されなくなってしまうなど
ドライバのサポート的にも切り捨てが進んでいるのが現状ですが
できれば2.1.0FE以降でも2.0.6FEと同等レベルを維持していただけるとありがたいと思います
(今後2.0.6FEも使い続けられるのであれば個人的には2.1.0FE以降はGCN Radeon専用でVLIW Radeonは2.0.6FEまで、という対応でも十分です)

ご面倒をおかけしますが以上よろしくお願いします
13022e7a anonymous [sage] 2016-04-16 07:25
>>ecbe82db
> 「詳細設定」の「GCNアセンブラを使用する」をオフにして試していただけますか?

動きましたー

Nano 2枚で
12桁 9000M/trips
10桁 488M/trips

GCNアセンブラを使用しなくても10桁そこそこ速度は出ているようです
c7f2fe68 anonymous 2016-04-16 11:03
>>2a247f1f
有料版でたらアナウンスお願いしま~す
俺もロクな金もってないけど
ec63e9b0 anonymous [sage] 2016-04-16 11:08
A10-7850K GPUのみ使用で検索速度(1パターン)診断
「GCNアセンブラを使用する」をオン 39.30M tripcode/s
「GCNアセンブラを使用する」をオフ 77.36M tripcode/s
668dfa28 anonymous [sage] 2016-04-16 11:10
ごめん、>>ec63e9b0のオン/オフ逆だった
010dec1e らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:25
新しいバージョンの公開ご苦労様です
中々12桁でいい速度がでました
ただ12桁の検索でHD5870を使うとPCの動作が極端に重くなって他の作業はほぼ不可能なのが残念です
まあ旧世代のグラボなのでこれは致し方ないことなのでしょう
10桁の方は速度の変化はあまり感じませんでした・・・・

【診断の種類】検索速度とヒット率(指定された検索パターン)
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 7 Ultimate
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】R9290X[1030MHZ]
【GPU1】HD5870[850MHZ]
【CPU】corei7 860

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】2
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  前方一致1個

【 2分間のGPU検索の平均速度】 4959.28M tripcode/s
【実際のヒット率と予想の差】+8% (550個)

【GPUの使用率】%
【GPUの温度】℃
【その他】CGNアセンブラON



【診断の種類】検索速度とヒット率(指定された検索パターン)
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 7 Ultimate
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】R9290X[1030MHZ]
【GPU1】HD5870[850MHZ]
【CPU】corei7 860

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】2
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】  前方一致1個

【 2分間のGPU検索の平均速度】  590.75M tripcode/s
【実際のヒット率と予想の差】-2% (59個)

【GPUの使用率】%
【GPUの温度】℃
【その他】CGNアセンブラON

e6211dd9 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:31
追記
あとウイルスバスターにウイルス扱いされる症状が改善しました
ありがとうございます
dbd57bff らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:32
ウイルスバスターじゃあねえ
アバストだった

修正します
38cc36d4 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:45
何度も連投して申し訳ないです

10桁の速度が上がらない理由がわかりました
既に同様の症状が報告されていましたが
どうやらHD5870はCGNがONだとこのバージョンでは10桁限定で速度が一切でない0MTPSになるようです

だとすると290X単体で590MTPSほど出ていたことになるのでかなりのパワーアップになります
うれしいような悲しいようなです

連投失礼しました
b0d2d4a1 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 13:11
5xxxや6xxxで10桁トリップ検索が動かないのは単純ミスです。
直すのは簡単なのでちょっと待って下さい。
9f10c90d anonymous [sage] 2016-04-16 14:06
>>ec63e9b0-117は10桁
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 8.1 Pro 64bit
【ディスプレイドライバ】Crimson 16.3.2

こっちは12桁
「GCNアセンブラを使用する」をオン 480.06M tripcode/s
「GCNアセンブラを使用する」をオフ 456.13M tripcode/s
36a5089e anonymous [sage] 2016-04-16 16:09
おつ
649d25dc ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 05:16
GCN 1.2の件は相当迷ったんですが、結局中古のR9 285を買って開発することにしました。PolarisとPascalまでにお金をためておかないと…
9aef392c anonymous 2016-04-17 07:36
>>bf451190
ご対応ありがとうございます
ですが2.1.0FEに新しいMerikensTripcodeEngine.exe/MerikensTripcodeEngine64.exeを
上書きして試してみてもHD6670で10桁が0MTPSのままになります
12桁は2.1.0FEオリジナルと同程度でした(2.0.6FE:約395MTPS 2.1.0FE:約375MTPS)
念のためにドライバをCatalyst15.11.1betaに変えても試してみましたが変化ありませんでした

あと別件ですが
http://anago.2ch.sc/test/read.cgi/software/1440928667/43-61n
あたりで出ていた「生成されたトリップの累計」の値が異常に増える現象が
2.1.0FEで再発するようになりました
こちらのPCはHD7790+Win7SP1 64bit+Catalyst15.7.1で
今のところ「GCNアセンブラを使用する」をオンにして
10桁をGPU検索した場合のみ発生しているようです
試しに>>bf451190のMerikensTripcodeEngine.exe/MerikensTripcodeEngine64.exeを
上書きした状態でも動かしてみましたがやはり発生します

同じPCで2.0.6FEに>>f06b4fb2の新エンジンを入れて10桁をGPU検索していると
表示上だけと思いますが検索速度が急に上がって
その後「検索スレッドが応答を停止しました」のエラーが出て検索が止まることがあったのですが
2.1.0FEで「生成されたトリップの累計」の値が異常に増える前にも
同じように検索速度が急に上がる現象が起きているようです
2.1.0FEではエラーで止まらずに検索を続けられるようになったみたいですので
その時の処理の関係で異常な値が出ている可能性があると思います

お手数おかけしますが以上よろしくお願いします
575ed1bb ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 07:41
>>9aef392c
報告助かります。さてどうしようかな…
6a35633a anonymous [sage] 2016-04-17 08:07
メリケンの生活もあるんやから
あんま無理せんでもええのよ
75de3f67 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 08:50
好きで息抜きにやってるだけなのでご心配なくw
f2ed7e88 anonymous 2016-04-17 09:57
>>0a4fa1a0
度々申し訳ありません
それを2.1.0FEに上書きして試してみましたところ無事HD6670で10桁GPU検索が動きました
ドライバは15.11.1betaと念のために15.7.1にも戻して試してみましたが
どちらでも大体2.0.6FEの時と同じ速度(約51MTPS)が出ているようです
ご対応どうもありがとうございました
c3879e0e ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 12:51
>>f2ed7e88
こちらこそ助かりました。よかったよかった。
9ae91f1b anonymous [sage] 2016-04-18 07:38
>>bd595c46
「GCNアセンブラを使用する」のチェックありだと12桁は問題ありませんが
10桁だとトリップ生成されないのでチェック無しの結果です

Nano 2GPUs
10桁 550M
1c32c0bf ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 07:58
>>9ae91f1b
動きませんでしたかorz やっぱりGCN 1.2の実機が手元にないとちょっと無理ですね、これは。
性能的にはNano 2台なら1.2G TPSは軽く超えるはずなので、R9-295Xが届いたらもうちょっと頑張ってみます。
8929533e ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 08:29
R9-285だった。金曜日まで待たなきゃいけないのはちょっとしんどいな~
f5a8c674 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 14:31
あれから気になってCodeXLでGCN 1.2のバイナリを作って調べてみたんですが、GCN 1.2とGCN 1.0/1.1ではソースコードレベルの互換性はないみたいですね。おなじように見えるけど何が違うんだろう…
ae87ea77 anonymous [sage] 2016-04-18 19:50
ハードウェア的な違いとしてはこういう記事がある
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20140926_668620.html
b9b02621 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 01:39
やっぱりGCN 1.0/1.1とGCN1.2でソースコードを共有するのは無理っぽいですね。
またカーネルを書きなおさなきゃならんのかorz
70f48917 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 09:29
…と思ってたんですが、共通のソースコードで全てのアーキテクチャに対応するうまい方法を見つけました。GCN 1.2のソースコードを書き換えてGCN 1.0/1.1で動かすことはできたので、あとは複数のソルトに対応させるだけです。単純作業なのでなんとかなるでしょう。
e1677762 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 23:09 1461074966.7z (2708KB)
検索エンジンを更新しました。今度こそGCN 1.2 (R9-285/Fury/Fury X/Nano)で10桁トリップ検索がちゃんとうごくといいなあ。GCN 1.0/1.1でもちょこっとだけ速くなっています。
44e69bbf ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 01:38
>>9aef392c
> 「生成されたトリップの累計」の値が異常に増える現象

これの原因がようやくわかりました。次のバージョンでは直っているはずです。
詳しい報告、本当に助かりました。
fe0261ca ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 01:52 1461084740.7z (2706KB)
ついでだからバグを直したバージョンもうpしておきます。
483e71f0 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 03:50
>>44e69bbf
うーん、まだたまにおかしくなりますね。
でもだいたい何が起きてるかわかったのでなんとかなるでしょう。
dfe13b52 anonymous [sage] 2016-04-20 10:32
おつ
f2bfd4e7 anonymous [sage] 2016-04-21 05:06
Nano 2GPUs
10桁 850M
12桁 9700M

GCNアセンブラを使用するで両方とも動きますが
10桁はGPU使用率が激しく上下し、GPUクロックも上限に張り付いています(12桁は上限設定より低いクロックで動きます)
効率よく動いていればNanoは電力制限でクロックは低く押さえられます(理論値に達しないのはこの辺が関係しているのかと)
それに加えCPU負荷も90%台で何かがおかしい感じです
06d90345 めりけん 2016-04-21 07:59
>>f2bfd4e7
お、動いたんですね!
10桁は電力制限のせいでしょう。
CPUには作業の一部を負担させているので問題ないです。
63f76597 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 13:52
>>bf1326dd
詳細設定->OpenCLの設定はどうなっていますか?
プロセスやスレッドの数を増やしてみるのもいいかもしれません。
a3d3f6c8 Nano [sage] 2016-04-21 15:43
うーん、プロセス14はageスギナ模様(エラー出る)
12に落としました
もっと少ない数でも十分かも知れない
365cc284 anonymous [sage] 2016-04-21 17:23
merikens-tripcode-engine-master.zip をビルドしようとしたら
>C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V140\BuildCustomizations\CUDA 7.5.props" が見つかりませんでした。
って言われたので、cuda_7.5.18_win10.exe をインストールしようとしたら、VS2015 はサポートしてないよ、って言われてしまった。
入れるのを間違えたのか。
3bef9dae ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 17:59
>>6ab3abef
なかなかいい数字ですね。290X 2枚で1.2G TPSぐらいなので、1.5G TPSというのは妥当な数字です。
あと多分プロセスの数は3か4で大丈夫なはずです。
デフォルトの値を増やしておいたほうがいいのかな。
f86b0e69 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 18:01
>>365cc284
GitHubにあるとおり、開発環境はVS2010です。たしかVS2013でもビルドできたはずです。
398cb2bf anonymous [sage] 2016-04-21 18:46
>>f86b0e69
> GitHubにあるとおり、開発環境はVS2010です。たしかVS2013でもビルドできたはずです。
では 2010 も 2013 も入れるか。
確か、別バージョンもインストール出来た筈でしたよね。
3dc15124 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 19:22
>>a3d3f6c8
プロセスの数はどれだけ落とせましたか。デフォルトの値の参考にしたいのでぜひ教えて下さい。
a4b1b680 Nano [sage] 2016-04-21 21:45
>>3dc15124
コンスタントに1.5G TPS出せるのはプロセス数10までですね
8だと1.4G台に落ちる率が増えます

※ここまでプロセス数を増やすと私のCPUではリソース不足になっているという疑念も(涙)
512bf659 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 03:51
>>4495a2c0
デフォルトだとその値はちょっと無理ですね。困ったなあ。
CPUの使用率を下げることは出来るんですけど、またカーネルを作りなおさなきゃいけないのでちょっと時間がかかります。
しかしなんで使用率が上がらないんでしょうね。ワークアイテムの数が足りないのかしらん。
d8e64f23 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 04:12
>>398cb2bf
できますよ~
1cd75298 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 04:22
詳しく調べてみたらCPUの負荷を下げるのはちょっと難しそうです。
なかなかうまく行きませんねえ。これがNano特有の問題かどうか気になるところです。
ちなみに早めに届いたR9  285では全く問題ありませんでした。
ad0cc288 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 11:51
あとNanoの使用率がなかなか上がらないのは電力制限による可能性も大いにあるので、くれぐれも気をつけてください。

現在新しいバージョンを用意しているところなのでしばらくお待ち下さい。
3c97e2f0 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-23 17:05
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.1.1 Free Edition
http://meriken.ygch.net/programming/merikens-tripcode-generator

バージョン2.1.1FEからの主な変更点は以下の通りです。

・AMD Radeon R9 285, Fury, Fury X, HD 5xxx/6xxxで10桁トリップ検索が動作しない不具合の修正。
・「生成されたトリップの累計」の値が異常になる不具合の修正。
d14ba32c anonymous 2016-04-24 02:17
新しいバージョンの「NVIDIA高速版」ではAMDのGCN搭載カードで10桁トリップ検索が実行出来ないことが判明orz
まあ多分誰も影響を受けないとは思いますが、あとで一応「NVIDIA高速版」だけ差し替えておきます。
966cdd31 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-24 03:45
新バージョンの「NVIDIA高速版」を差し替えておいたので、>>d14ba32cの問題が出る人は再ダウンロードしてください。
97627328 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-24 12:53
新バージョン乙です
早速試したので報告します
ドライバはCatalyst15.7.1です

使用GPUはメインがR9290XでサブがHD5870です

HD5870は10桁で850MHZ動作で150MTPS前後 (OCNナシ)
OCNアリでも155MTPS前後です
(ワークアイテム数等各種設定はデフォルト)
バージョン2.06が160~170MTPS前後なので少し速度が落ちた感じになります

HD5870の12桁検索はアプリケーションの内部エラーでそもそも検索すら開始できませんでした・・


R9290Xは前回の1.1.0と変化ナシです
心なしかちょっと12桁が早くなった気もしますが
最近暖かい日が続いたのでクロックを下げて運用していたからでしょうか・・・











c438d74b ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-24 21:27
>>97627328
確かに5xxxと6xxxで12桁トリップ検索ができなくなっていますね。直しておきます。
10桁トリップ検索が遅くなってるのは謎です。ちょっと調べてみます。

Top of this page. | <<last <<new 0 1 2 3 4 5 6 7 old>>

limit: 1536KB

(Meriken's Tripcode Generator/361/12.8MB)

Powered by shinGETsu.