アカウント名:
パスワード:
「ウェブサイト」を「ホームページ」と呼ぶと怒る技術者の中にも「message digest」を「ハッシュ値」と平気で言っている人が非常に多かった印象なので、「ハッシュとの照合」と言うと「いわゆるファイルの SHA-256 ハッシュとかの値」と照合していると勘違いする人が出てきそうですが、そうではありません。
これは、画像の一部だけを書き換えるなどしてファイルの message digest が違っても、児童ポルノだと検出できる方式で、照合しているのは画像の特徴を抽出したデータで完全一致ではなくても検出されます。
誤検出の可能性は非常に低いとされてますが0ではありません(所謂ハッシュの衝突がどうのという話ではなく、それよりは遥かに高い確率ですしその確率が正しいと検証することも困難です)。
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。ただ、このハッシュ関数はファイルデータそのものに対して適用するのではないというだけです。
よく言われるのが、「児童ポルノを見つけるってことは、そのサービスの提供元は児童ポルノ画像を大量に持ってるんじゃね?」っていう誤解で、この問題を回避するために画像の特徴をハッシュ化して持っているわけです。
# とはいえ、何もない状態からハッシュ値を得られるかというとそうでもないわけで、# 必ず初期の学習段階ではそれなりの数の児童ポルノ(とそうでないもの)を処理しなければならない矛盾もあったりしますが・・・・
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
その論理だと、「USB」とは「コンピュータ等の情報機器に周辺機器を接続するためUniversal Serial Busというシリアルバス規格の製品」なので、「(USB規格を満たした)USBメモリ」もそのうちの1つなので問題ないことになりませんか。狭義の概念を示すのに、広義な単語を使用することは誤解を招くことになるので望ましくないのではないでしょうか。
例えば、パソコンだけでなくスマートフォンもゲーム機も電卓も「コンピュータ」と読んだら語弊があるはず。
君が「ハッシュ関数」「ハッシュ値」「メッセージダイジェスト」という用語を勝手にSHA256のような数十バイトのスカラ値や値を与える関数だと狭く定義してるだけ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
「ハッシュとの照合」の「ハッシュ」は「message digest」ではないので注意 (スコア:2, 参考になる)
「ウェブサイト」を「ホームページ」と呼ぶと怒る技術者の中にも「message digest」を「ハッシュ値」と平気で言っている人が非常に多かった印象なので、
「ハッシュとの照合」と言うと「いわゆるファイルの SHA-256 ハッシュとかの値」と照合していると勘違いする人が出てきそうですが、そうではありません。
これは、画像の一部だけを書き換えるなどしてファイルの message digest が違っても、児童ポルノだと検出できる方式で、
照合しているのは画像の特徴を抽出したデータで完全一致ではなくても検出されます。
誤検出の可能性は非常に低いとされてますが0ではありません(所謂ハッシュの衝突がどうのという話ではなく、それよりは遥かに高い確率ですしその確率が正しいと検証することも困難です)。
Re: (スコア:4, 興味深い)
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
ただ、このハッシュ関数はファイルデータそのものに対して適用するのではないというだけです。
よく言われるのが、「児童ポルノを見つけるってことは、そのサービスの提供元は児童ポルノ画像を大量に持ってるんじゃね?」っていう誤解で、この問題を回避するために画像の特徴をハッシュ化して持っているわけです。
# とはいえ、何もない状態からハッシュ値を得られるかというとそうでもないわけで、
# 必ず初期の学習段階ではそれなりの数の児童ポルノ(とそうでないもの)を処理しなければならない矛盾もあったりしますが・・・・
「USBメモリ」を「USB」と呼んで良い? (スコア:0)
「ハッシュ値」とは「ハッシュ関数(任意のデータから別のデータを得る関数)で生成した値」なので、message digestもそのうちの1つで間違ってはいないですよ。
その論理だと、「USB」とは「コンピュータ等の情報機器に周辺機器を接続するためUniversal Serial Busというシリアルバス規格の製品」なので、「(USB規格を満たした)USBメモリ」もそのうちの1つなので問題ないことになりませんか。
狭義の概念を示すのに、広義な単語を使用することは誤解を招くことになるので望ましくないのではないでしょうか。
例えば、パソコンだけでなくスマートフォンもゲーム機も電卓も「コンピュータ」と読んだら語弊があるはず。
Re:「USBメモリ」を「USB」と呼んで良い? (スコア:0)
君が「ハッシュ関数」「ハッシュ値」「メッセージダイジェスト」という用語を
勝手にSHA256のような数十バイトのスカラ値や値を与える関数だと狭く定義してるだけ