Meriken's Tripcode Generator

12502819 らんらん◆IMWagR89Dsve Dx6mQoOZ/Vs 2016-03-20 15:00
結局バージョン15.12に戻しました

10桁の検索は出来ませんがまあ元々12ケタ専門なのであきらめます
ade1ac8f ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-21 09:36
>>aa824a40
7-zipを使ってアセンブラのソースを圧縮すればこの方法でもなんとか行けることがわかったので、とりあえずためしてみることにします。強引な事この上ないですが、まあ仕方がありません。
68fee916 ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-21 09:38
>>12502819
この問題を解決できるめどは大体ついたので、もうちょっと待って下さい。 
0683e035 ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-21 13:39
カーネルが1万個ほど出来てから流石に考えなおして、代わりにディスアセンブルしたカーネルをいじることにしました。最初からちゃんと動くものがあるのは非常に楽なんですが、そのままでは単一のsaltでしか動かないので、なんとか改造して複数のsaltに対応させたいところです。
79c80e7e らんらん◆IMWagR89Dsve Dx6mQoOZ/Vs 2016-03-22 08:43
>>68fee916
ありがとうございます
のんびり待ちます~
bc4ee7ab ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-26 05:45
ここ1周間ぐらいずっとGCNアセンブラをいじってますけど、やっぱりというかドライバの出力したコードには結構無駄があります。レジスタの数もかなり削れそうだけど、どれぐらいはやくなるかな~
4fe8d139 ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-29 20:39
10桁トリップ検索のOpenCLカーネルのGCNアセンブラでの書き換えですが、ようやく複数のsaltで検索ができるようになりました。saltに応じて動的にアセンブラのソースを生成しています。技術的に一番難しい部分だったので、これで一安心です。

アセンブラでの書き換えによる速度の増加は、とりあえず10%程度になりそうです。OCした290Xで660M TPSほど出ています。実験での値とほぼ同じなんですが、もうちょっとなんとかならないかしらん。
541e542d anonymous 2016-03-29 22:26
いまさらなんですが、これはどういう目的のツール?
e9e68cfc anonymous 2016-03-30 03:11
>>4fe8d139
390X使いなので非常にうれしいです。
バージョンアップ楽しみにしてます(*´∇`*)
(何気にここで初書き込みなのでミスってたら失礼
e803910b ◆99999999mS/i Dx6mQoOZ/Vs 2016-03-30 08:31
>>541e542d
カッコつけて妙にハイスペックなゲーミングPCやワークステーションを買ってしまったものの
2ちゃんねるしかやらないのでただの箱になってるPCの余ったマシンパワーを2ちゃんライフに活かすべく
そんなかわいそうなネラーの為にメリケンさんが苦心して作った最新技術てんこ盛りのトリップ検索ツールです

まあ冗談はそこまでにしておいて本題です
名前欄に半角#を打ち込んだあと適当な文字列を打ち込むと暗号化されて全く別の文字列に変換されて表示される機能がありますがこれがトリップです 下にある文字列を名前欄に打ち込んでみてください◆99999999mS/iと表示されるはずです。

#峠>ウムョウッレq但

以上のように指定した文字列トリップをマシンパワーで総当りで検索するのがこのソフトです
CPUだけではなくグラフィックボード(GPU)も検索に使用できるのが最大の特徴です
また裏の目的としてこのソフトには優秀なベンチマーク機能が付いてるのでopenCLやCUDAのベンチマーク
にも最適です

中々面白いので御自慢のマシンをお持ちなら是非

e91651c1 anonymous 2016-03-30 10:35
>>e803910b
解説乙。あと付け加えると、新月でトリップを使えるのはゆぐちゃんねる( http://ygg.ch/ )だけだから一応注意してね。
28b5f2e4 ◆/Meriken/. Dx6mQoOZ/Vs 2016-03-31 11:07
新バージョンをクロック周波数を半分に落とした検索君1号で動かしたら、1500M TPSほどでました。本来なら3000M TPS出る計算ですが、効率が良くなりすぎて1200Wの電源では全く足りないようです。検索君1号を組み立てたのも2年半前なのでそろそろ新しくしたいんですけど、資金が全然ないです。なかなか難しいですね。
29ec9f09 anonymous 2016-03-31 16:48
まあHD7990とR9290Xでしたっけ?
旧式っちゃ旧式ですけど十分今でも化け物じみてますよ
2245ab31 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-01 14:10
値崩れしてる295X2を3枚乗っければもっと速くなりますよw

最近不調だった検索君ですが、いつも通りPCI-Eの補助電源ケーブルのプラグが溶解して破損してました。新品のプラグと交換したら、何もなかったかのように動いてます。なかなかしぶといです。
735fc525 anonymous [sage] 2016-04-01 19:14
溶解とか相変わらずこえーな
29818ea0 anonymous [sage] 2016-04-02 03:37
うちは電源側のコネクタ端子が過電流で溶接されてしまって抜けなくなった
ケーブル交換も出来ないので電源換装したよ
f554f80b anonymous 2016-04-02 10:39
>>2245ab31
たしか一枚500Wでしたっけ?
でも1500Wじゃ足りませんね~
最低でも1000W電源をデュアル構成にしないと・・・
てか日本じゃコンセント一系統じゃまかなえないwwww

a971faa8 anonymous 2016-04-02 17:47
個人宅でこれをやるというのか…
http://akiba-pc.watch.impress.co.jp/img/ah/docs/725/916/html/gtx9.jpg.html
9ccc3b5c ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-04 01:34
現在GCNアセンブラ(CLRadeonExtender)がOpenCL2.0に対応するのを待っている状況なんですが、待ちくたびれたのでなんとか自分でダミーカーネルに動的にパッチを当てられないか実験中です。ダミーカーネルのELFファイルを読み込むところまではうまくいったんですが、資料が殆ど無いのでかなり面倒くさそうです。うまく行けばかなり美味しいんだけど、どうかな~
724c4612 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-04 01:39
>>f554f80b
EVGAの1600Wのでなんとかなるんじゃないでしょうか。電源の2台構成は自分の使ってるマザボではうまくいかなかったんですよね。電圧があんまり安定しないみたいです。新しいPCを組むならグラボを含めて全部簡易水冷にするのもいいかもしれませんね。普通の水冷だと引っ越しが大変すぎです。
be3b44c5 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-06 07:22
ようやくOpenCLのバイナリに動的にパッチを当てる実験に成功しました。バイナリはELF方式なのでlibelfを使えば楽勝だと思ってたんですが、バイナリの形式が特殊すぎてうまく行きませんでした。結局elfioという別のライブラリを改造して対応しました。やれやれです。
a9d136c9 anonymous [sage] 2016-04-06 11:10
おつ
b4297b3e anonymous 2016-04-06 18:06
>>724c4612
おつかれさまです
新MTG楽しみに待っております
d1587bd8 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-07 02:19
以前のドライバのフォーマットについては、ここに詳しく書かれていました。

Appendix B: CAL Binary Format Specification
http://developer.amd.com/wordpress/media/2012/10/AMD_CAL_Programming_Guide_v2.0.pdf
fc726c41 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-09 06:15
OpenCL 2.0のドライバではOpenCL 1.2のドライバのバイナリは使えないことがわかったので、またせっせとディスアセンブルしたカーネルを書き換えています。コツはつかめたので前ほどは時間がかかりませんが、けっこう大変な作業なのには変わりありません。アセンブラを使わずに済めばそれに越したことはないので、MTGの新バージョンができたらAMDのドライバのソースを調べてみようっと。
4732a33a ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-09 07:08
キタ━━━━(゚∀゚)━━━━!!
ようやくCLRadeonExtenderがOpenCL 2.0に対応してくれたようです。うちに帰ったら試してみようっと。

CLRadeonExtender: Update ClrxDoc and add AmdCL2 format handling.
https://github.com/CLRX/CLRX-mirror/commit/0ef3230eaddf33ecc9583eb6eff2577a4299b4be
b3d4907e anonymous 2016-04-09 12:26
最近ゆぐちゃんねるの12ケタ元気ありませんね
10ケタは結構なペースで回ってますが
1df6810e ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-09 16:30
>>b3d4907e
もともと10桁のほうが人が多かったし、検索君が開発で抜けてますしね。
そのうちまた増えるでしょう。
5f9b2116 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-09 16:33
CLRadeonExtenderのOpenCL 2.0対応はまだ未完成でしたw
素直にバージョンアップまで待つことにしようっと。
f81a396f anonymous [sage] 2016-04-09 20:08
したらばとかが10桁のみだし
やっぱ汎用性が高いからかねー
しゃーなしやね
f2a49b69 anonymous [sage] 2016-04-09 21:11
それじゃ回してみますね
d2b2bf44 anonymous 2016-04-09 22:28
R9 NANOって8000MTPS出るのかよ・・・ガクブル


俺の290Xは春の陽気のせいで定格ですら回せません・・・嗚呼
fd0138f5 anonymous [sage] 2016-04-09 22:31
>>d2b2bf44
2機掛けです
36312b41 anonymous 2016-04-10 08:04
>>fd0138f5
おー2wayですか

さすがfijiデュアル仕様ですね
37d6423c ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-12 15:52
ようやく新バージョンの検索エンジンがひと通り動くようになりました。GCNアセンブラのおかげで、AMDのビデオカードでドライバのバージョンに関係なく安定して性能が出るようになった上に、性能も少し上がっています。自分でビルドできる人は試してみてください。CLRadeonExtenderフォルダとOpenCLフォルダを忘れずにコピーしてください。VS2015のランタイムも必要です。
  
https://github.com/meriken/merikens-tripcode-engine
f06b4fb2 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-12 16:34 1460446491.7z (3164KB)
あ、そうか。添付すればいいのか。
3937fffd ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-12 16:38
>>f06b4fb2に新しい検索エンジンを添付しておきました。
使うときは「検索プロセスの優先度」を「通常以上」にしてください。
fe085f1f anonymous 2016-04-12 17:56
>>37d6423c
お疲れさまです

4fedc117 anonymous 2016-04-13 20:57
>>37d6423c
早速使わせてもらいました@R9 390X
OC無しですが検索パターンたっぷりでも10桁500M↑出ております。
基本電力制限しながらと思いますがちょこちょこ参加させて頂きます。

バージョンアップありがとうございました(*ノωノ)
e74c8292 anonymous [sage] 2016-04-14 00:44
>>37d6423c
やってみたら、
MERIKENsTripcodeEngine.vcxproj が
C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V140\BuildCustomizations\vsyasm.props を
参照してるらしいのですが、それが存在しませんでした。
その中には 15 個のファイルがあるけど、何故かそのファイルは無かった・・・
bdafacff anonymous [sage] 2016-04-14 01:38
メリケンさん乙
自ビルド派の人も乙

軟弱者の自分は>>f06b4fb2をそのまま使わせてもらいます・・・
f304c3f8 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-14 02:58
>>e74c8292
ここのWin* VS2010 .zipに入ってます。もちろんyasmのインストールも必要です。

http://yasm.tortall.net/Download.html
7d936839 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 01:19
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.1.0 Free Edition
http://meriken.ygch.net/programming/merikens-tripcode-generator

バージョン2.0.6FEからの主な変更点は以下の通りです。

・GCNアセンブラ(CLRadeonExtender)の導入による、AMDのビデオカードでの検索速度の安定化と高速化。
・アプリケーションの実行ファイルがアンチウイルスソフトウェアに誤検出される問題の改善。
f96f2c85 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 01:24
>>7d936839には重要な修正が追加されているので、>>f06b4fb2を使用している人も再ダウンロードをお願いします。
2a247f1f ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 01:26
■寄付のお願い

「Meriken's Tripcode Generator」と「Meriken's Tripcode Yggdrasil」の開発・運営費の寄付を募集しています。PayPal経由で meriken.ygch.net@gmail.com まで、 もしくはBitcoinで 1BZrWADRhLr9DyQYYRJhRcmudE3vntT5em までお願いします。
b480e4a9 anonymous [sage] 2016-04-16 03:30
>>7d936839
MerikensTripcodeEngine64.exeが動作を停止して検索開始出来ません

障害バケット 120454565473、種類 4
イベント名: APPCRASH
応答: 使用不可
Cab ID: 0

問題の署名:
P1: MerikensTripcodeEngine64.exe
P2: 0.0.0.0
P3: 570fd608
P4: OpenCL.dll
P5: 1.2.10.0
P6: 50a52df7
P7: c0000005
P8: 0000000000001bb4
P9:
P10:
6af9b9c3 anonymous [sage] 2016-04-16 03:35
>>b480e4a9
障害が発生しているアプリケーション名: MerikensTripcodeEngine64.exe、バージョン: 0.0.0.0、タイム スタンプ: 0x570fd608
障害が発生しているモジュール名: OpenCL.dll、バージョン: 1.2.10.0、タイム スタンプ: 0x50a52df7
例外コード: 0xc0000005
障害オフセット: 0x0000000000001bb4
障害が発生しているプロセス ID: 0x1c7c
障害が発生しているアプリケーションの開始時刻: 0x01d19743bf041506
障害が発生しているアプリケーション パス: F:\MerikensTripcodeGenerator_2.1.0_FE\MerikensTripcodeEngine64.exe
障害が発生しているモジュール パス: F:\MerikensTripcodeGenerator_2.1.0_FE\OpenCL.dll
レポート ID: 581fefe9-3d3e-4e1f-8c84-3b40d4f19c8a
障害が発生しているパッケージの完全な名前:
障害が発生しているパッケージに関連するアプリケーション ID:
d84c1a2f ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 03:39
>>b480e4a9
使用しているビデオカードと、OSとドライバのバージョンを教えて下さい。
「Visual Studio 2015 の Visual C++ 再頒布可能パッケージ」はインストールされていますか。
5cad4082 anonymous [sage] 2016-04-16 04:03
>>d84c1a2f
Windows10 x64
R9 Nano
Radeon-Software-Crimson-16.4.1

Visual Studio 2015 の Visual C++ 再頒布可能パッケージは入っています
ecbe82db ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 06:53
>>5cad4082
Fiji (GCN 1.2)ではテストしてなかったんですけど、やっぱり動きませんでしたか…
「詳細設定」の「GCNアセンブラを使用する」をオフにして試していただけますか?
10桁と12桁両方やっていただけると助かります。少なくとも12桁は普通に動くはずです。 
64a6d620 anonymous 2016-04-16 07:23
新バージョン乙です

HD6670+Win7SP1 64bit+Catalyst15.7.1のPCで2.1.0FEを動かしてみたのですが
ローカルでの診断でもYggdrasilに接続しての検索でも
10桁をGPU検索しようとするといつまで経っても0MTPSのままでGPU検索ができません
(GPU使用率が0のままでGPUクロックもアイドル状態のまま変化しません)
あと12桁も数回診断した平均値で2.0.6FEに比べて少し(5%程度)速度が落ちてしまっているようです

タスクマネージャでプロセスを見ていると
2.0.6FEや2.1.0FEでも12桁の場合は検索中にMerikensTripcodeEngine64.exeが3個起動していて
1個がCPU検索用?で2個がGPU検索用?に動いているような感じですが
2.1.0FEの10桁の場合はGPU検索用?のMerikensTripcodeEngine64.exeが
起動して数秒後に消えて1分後くらいにまた起動して…を繰り返しているように見えます

ちなみに[詳細設定]で2.1.0FEから新設の[GCNアセンブラを使用する]のチェックを切り替えて試してみたり
その他の設定(ワークアイテム数/プロセス数/スレッド数/優先度など)も思いつく限り変えて試してみましたが
今のところどうやってもHD6670+2.1.0FEで10桁のGPU検索ができない状態です

今回の新バージョンはGCN Radeonへの対応がメインと思いますし
VLIW Radeonは専用のベータ版Crimsonドライバを入れるとWindowsからOpenCLデバイスとして認識されなくなってしまうなど
ドライバのサポート的にも切り捨てが進んでいるのが現状ですが
できれば2.1.0FE以降でも2.0.6FEと同等レベルを維持していただけるとありがたいと思います
(今後2.0.6FEも使い続けられるのであれば個人的には2.1.0FE以降はGCN Radeon専用でVLIW Radeonは2.0.6FEまで、という対応でも十分です)

ご面倒をおかけしますが以上よろしくお願いします
13022e7a anonymous [sage] 2016-04-16 07:25
>>ecbe82db
> 「詳細設定」の「GCNアセンブラを使用する」をオフにして試していただけますか?

動きましたー

Nano 2枚で
12桁 9000M/trips
10桁 488M/trips

GCNアセンブラを使用しなくても10桁そこそこ速度は出ているようです
c7f2fe68 anonymous 2016-04-16 11:03
>>2a247f1f
有料版でたらアナウンスお願いしま~す
俺もロクな金もってないけど
ec63e9b0 anonymous [sage] 2016-04-16 11:08
A10-7850K GPUのみ使用で検索速度(1パターン)診断
「GCNアセンブラを使用する」をオン 39.30M tripcode/s
「GCNアセンブラを使用する」をオフ 77.36M tripcode/s
668dfa28 anonymous [sage] 2016-04-16 11:10
ごめん、>>ec63e9b0のオン/オフ逆だった
010dec1e らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:25
新しいバージョンの公開ご苦労様です
中々12桁でいい速度がでました
ただ12桁の検索でHD5870を使うとPCの動作が極端に重くなって他の作業はほぼ不可能なのが残念です
まあ旧世代のグラボなのでこれは致し方ないことなのでしょう
10桁の方は速度の変化はあまり感じませんでした・・・・

【診断の種類】検索速度とヒット率(指定された検索パターン)
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 7 Ultimate
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】R9290X[1030MHZ]
【GPU1】HD5870[850MHZ]
【CPU】corei7 860

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】2
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】  前方一致1個

【 2分間のGPU検索の平均速度】 4959.28M tripcode/s
【実際のヒット率と予想の差】+8% (550個)

【GPUの使用率】%
【GPUの温度】℃
【その他】CGNアセンブラON



【診断の種類】検索速度とヒット率(指定された検索パターン)
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 7 Ultimate
【ディスプレイドライバ】Catalyst 15.7.1

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】R9290X[1030MHZ]
【GPU1】HD5870[850MHZ]
【CPU】corei7 860

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】2
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】  前方一致1個

【 2分間のGPU検索の平均速度】  590.75M tripcode/s
【実際のヒット率と予想の差】-2% (59個)

【GPUの使用率】%
【GPUの温度】℃
【その他】CGNアセンブラON

e6211dd9 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:31
追記
あとウイルスバスターにウイルス扱いされる症状が改善しました
ありがとうございます
dbd57bff らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:32
ウイルスバスターじゃあねえ
アバストだった

修正します
38cc36d4 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-16 11:45
何度も連投して申し訳ないです

10桁の速度が上がらない理由がわかりました
既に同様の症状が報告されていましたが
どうやらHD5870はCGNがONだとこのバージョンでは10桁限定で速度が一切でない0MTPSになるようです

だとすると290X単体で590MTPSほど出ていたことになるのでかなりのパワーアップになります
うれしいような悲しいようなです

連投失礼しました
b0d2d4a1 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-16 13:11
5xxxや6xxxで10桁トリップ検索が動かないのは単純ミスです。
直すのは簡単なのでちょっと待って下さい。
9f10c90d anonymous [sage] 2016-04-16 14:06
>>ec63e9b0-117は10桁
【Meriken's Tripcode Generatorのバージョン】2.1.0 Free Edition
【OS】Windows 8.1 Pro 64bit
【ディスプレイドライバ】Crimson 16.3.2

こっちは12桁
「GCNアセンブラを使用する」をオン 480.06M tripcode/s
「GCNアセンブラを使用する」をオフ 456.13M tripcode/s
36a5089e anonymous [sage] 2016-04-16 16:09
おつ
649d25dc ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 05:16
GCN 1.2の件は相当迷ったんですが、結局中古のR9 285を買って開発することにしました。PolarisとPascalまでにお金をためておかないと…
9aef392c anonymous 2016-04-17 07:36
>>bf451190
ご対応ありがとうございます
ですが2.1.0FEに新しいMerikensTripcodeEngine.exe/MerikensTripcodeEngine64.exeを
上書きして試してみてもHD6670で10桁が0MTPSのままになります
12桁は2.1.0FEオリジナルと同程度でした(2.0.6FE:約395MTPS 2.1.0FE:約375MTPS)
念のためにドライバをCatalyst15.11.1betaに変えても試してみましたが変化ありませんでした

あと別件ですが
http://anago.2ch.sc/test/read.cgi/software/1440928667/43-61n
あたりで出ていた「生成されたトリップの累計」の値が異常に増える現象が
2.1.0FEで再発するようになりました
こちらのPCはHD7790+Win7SP1 64bit+Catalyst15.7.1で
今のところ「GCNアセンブラを使用する」をオンにして
10桁をGPU検索した場合のみ発生しているようです
試しに>>bf451190のMerikensTripcodeEngine.exe/MerikensTripcodeEngine64.exeを
上書きした状態でも動かしてみましたがやはり発生します

同じPCで2.0.6FEに>>f06b4fb2の新エンジンを入れて10桁をGPU検索していると
表示上だけと思いますが検索速度が急に上がって
その後「検索スレッドが応答を停止しました」のエラーが出て検索が止まることがあったのですが
2.1.0FEで「生成されたトリップの累計」の値が異常に増える前にも
同じように検索速度が急に上がる現象が起きているようです
2.1.0FEではエラーで止まらずに検索を続けられるようになったみたいですので
その時の処理の関係で異常な値が出ている可能性があると思います

お手数おかけしますが以上よろしくお願いします
575ed1bb ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 07:41
>>9aef392c
報告助かります。さてどうしようかな…
6a35633a anonymous [sage] 2016-04-17 08:07
メリケンの生活もあるんやから
あんま無理せんでもええのよ
75de3f67 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 08:50
好きで息抜きにやってるだけなのでご心配なくw
f2ed7e88 anonymous 2016-04-17 09:57
>>0a4fa1a0
度々申し訳ありません
それを2.1.0FEに上書きして試してみましたところ無事HD6670で10桁GPU検索が動きました
ドライバは15.11.1betaと念のために15.7.1にも戻して試してみましたが
どちらでも大体2.0.6FEの時と同じ速度(約51MTPS)が出ているようです
ご対応どうもありがとうございました
c3879e0e ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-17 12:51
>>f2ed7e88
こちらこそ助かりました。よかったよかった。
9ae91f1b anonymous [sage] 2016-04-18 07:38
>>bd595c46
「GCNアセンブラを使用する」のチェックありだと12桁は問題ありませんが
10桁だとトリップ生成されないのでチェック無しの結果です

Nano 2GPUs
10桁 550M
1c32c0bf ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 07:58
>>9ae91f1b
動きませんでしたかorz やっぱりGCN 1.2の実機が手元にないとちょっと無理ですね、これは。
性能的にはNano 2台なら1.2G TPSは軽く超えるはずなので、R9-295Xが届いたらもうちょっと頑張ってみます。
8929533e ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 08:29
R9-285だった。金曜日まで待たなきゃいけないのはちょっとしんどいな~
f5a8c674 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-18 14:31
あれから気になってCodeXLでGCN 1.2のバイナリを作って調べてみたんですが、GCN 1.2とGCN 1.0/1.1ではソースコードレベルの互換性はないみたいですね。おなじように見えるけど何が違うんだろう…
ae87ea77 anonymous [sage] 2016-04-18 19:50
ハードウェア的な違いとしてはこういう記事がある
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20140926_668620.html
b9b02621 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 01:39
やっぱりGCN 1.0/1.1とGCN1.2でソースコードを共有するのは無理っぽいですね。
またカーネルを書きなおさなきゃならんのかorz
70f48917 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 09:29
…と思ってたんですが、共通のソースコードで全てのアーキテクチャに対応するうまい方法を見つけました。GCN 1.2のソースコードを書き換えてGCN 1.0/1.1で動かすことはできたので、あとは複数のソルトに対応させるだけです。単純作業なのでなんとかなるでしょう。
e1677762 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-19 23:09 1461074966.7z (2708KB)
検索エンジンを更新しました。今度こそGCN 1.2 (R9-285/Fury/Fury X/Nano)で10桁トリップ検索がちゃんとうごくといいなあ。GCN 1.0/1.1でもちょこっとだけ速くなっています。
44e69bbf ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 01:38
>>9aef392c
> 「生成されたトリップの累計」の値が異常に増える現象

これの原因がようやくわかりました。次のバージョンでは直っているはずです。
詳しい報告、本当に助かりました。
fe0261ca ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 01:52 1461084740.7z (2706KB)
ついでだからバグを直したバージョンもうpしておきます。
483e71f0 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-20 03:50
>>44e69bbf
うーん、まだたまにおかしくなりますね。
でもだいたい何が起きてるかわかったのでなんとかなるでしょう。
dfe13b52 anonymous [sage] 2016-04-20 10:32
おつ
f2bfd4e7 anonymous [sage] 2016-04-21 05:06
Nano 2GPUs
10桁 850M
12桁 9700M

GCNアセンブラを使用するで両方とも動きますが
10桁はGPU使用率が激しく上下し、GPUクロックも上限に張り付いています(12桁は上限設定より低いクロックで動きます)
効率よく動いていればNanoは電力制限でクロックは低く押さえられます(理論値に達しないのはこの辺が関係しているのかと)
それに加えCPU負荷も90%台で何かがおかしい感じです
06d90345 めりけん 2016-04-21 07:59
>>f2bfd4e7
お、動いたんですね!
10桁は電力制限のせいでしょう。
CPUには作業の一部を負担させているので問題ないです。
63f76597 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 13:52
>>bf1326dd
詳細設定->OpenCLの設定はどうなっていますか?
プロセスやスレッドの数を増やしてみるのもいいかもしれません。
a3d3f6c8 Nano [sage] 2016-04-21 15:43
うーん、プロセス14はageスギナ模様(エラー出る)
12に落としました
もっと少ない数でも十分かも知れない
365cc284 anonymous [sage] 2016-04-21 17:23
merikens-tripcode-engine-master.zip をビルドしようとしたら
>C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V140\BuildCustomizations\CUDA 7.5.props" が見つかりませんでした。
って言われたので、cuda_7.5.18_win10.exe をインストールしようとしたら、VS2015 はサポートしてないよ、って言われてしまった。
入れるのを間違えたのか。
3bef9dae ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 17:59
>>6ab3abef
なかなかいい数字ですね。290X 2枚で1.2G TPSぐらいなので、1.5G TPSというのは妥当な数字です。
あと多分プロセスの数は3か4で大丈夫なはずです。
デフォルトの値を増やしておいたほうがいいのかな。
f86b0e69 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 18:01
>>365cc284
GitHubにあるとおり、開発環境はVS2010です。たしかVS2013でもビルドできたはずです。
398cb2bf anonymous [sage] 2016-04-21 18:46
>>f86b0e69
> GitHubにあるとおり、開発環境はVS2010です。たしかVS2013でもビルドできたはずです。
では 2010 も 2013 も入れるか。
確か、別バージョンもインストール出来た筈でしたよね。
3dc15124 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-21 19:22
>>a3d3f6c8
プロセスの数はどれだけ落とせましたか。デフォルトの値の参考にしたいのでぜひ教えて下さい。
a4b1b680 Nano [sage] 2016-04-21 21:45
>>3dc15124
コンスタントに1.5G TPS出せるのはプロセス数10までですね
8だと1.4G台に落ちる率が増えます

※ここまでプロセス数を増やすと私のCPUではリソース不足になっているという疑念も(涙)
512bf659 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 03:51
>>4495a2c0
デフォルトだとその値はちょっと無理ですね。困ったなあ。
CPUの使用率を下げることは出来るんですけど、またカーネルを作りなおさなきゃいけないのでちょっと時間がかかります。
しかしなんで使用率が上がらないんでしょうね。ワークアイテムの数が足りないのかしらん。
d8e64f23 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 04:12
>>398cb2bf
できますよ~
1cd75298 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 04:22
詳しく調べてみたらCPUの負荷を下げるのはちょっと難しそうです。
なかなかうまく行きませんねえ。これがNano特有の問題かどうか気になるところです。
ちなみに早めに届いたR9  285では全く問題ありませんでした。
ad0cc288 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-22 11:51
あとNanoの使用率がなかなか上がらないのは電力制限による可能性も大いにあるので、くれぐれも気をつけてください。

現在新しいバージョンを用意しているところなのでしばらくお待ち下さい。
3c97e2f0 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-23 17:05
新しい開発版をうpしました。

Meriken's Tripcode Generator 2.1.1 Free Edition
http://meriken.ygch.net/programming/merikens-tripcode-generator

バージョン2.1.1FEからの主な変更点は以下の通りです。

・AMD Radeon R9 285, Fury, Fury X, HD 5xxx/6xxxで10桁トリップ検索が動作しない不具合の修正。
・「生成されたトリップの累計」の値が異常になる不具合の修正。
d14ba32c anonymous 2016-04-24 02:17
新しいバージョンの「NVIDIA高速版」ではAMDのGCN搭載カードで10桁トリップ検索が実行出来ないことが判明orz
まあ多分誰も影響を受けないとは思いますが、あとで一応「NVIDIA高速版」だけ差し替えておきます。
966cdd31 ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-24 03:45
新バージョンの「NVIDIA高速版」を差し替えておいたので、>>d14ba32cの問題が出る人は再ダウンロードしてください。
97627328 らんらん◆SSSSSSSSSSwl Dx6mQoOZ/Vs 2016-04-24 12:53
新バージョン乙です
早速試したので報告します
ドライバはCatalyst15.7.1です

使用GPUはメインがR9290XでサブがHD5870です

HD5870は10桁で850MHZ動作で150MTPS前後 (OCNナシ)
OCNアリでも155MTPS前後です
(ワークアイテム数等各種設定はデフォルト)
バージョン2.06が160~170MTPS前後なので少し速度が落ちた感じになります

HD5870の12桁検索はアプリケーションの内部エラーでそもそも検索すら開始できませんでした・・


R9290Xは前回の1.1.0と変化ナシです
心なしかちょっと12桁が早くなった気もしますが
最近暖かい日が続いたのでクロックを下げて運用していたからでしょうか・・・











c438d74b ◆/Meriken/. Dx6mQoOZ/Vs 2016-04-24 21:27
>>97627328
確かに5xxxと6xxxで12桁トリップ検索ができなくなっていますね。直しておきます。
10桁トリップ検索が遅くなってるのは謎です。ちょっと調べてみます。

Top of this page. | <<last <<new 0 1 2 3 old>>

limit: 15360KB

(Meriken's Tripcode Generator/361/12.8MB)


Powered by shinGETsu.