2009年3月1日星期日

关于文件的指纹

我们为了形成知识,先从语言开始的,有了语言,就有积累,通过语言记录就成为文明传递的基石。
电子文件从来是我们在互联网时代的文明传递的工具。
将每个可以划分的电子文件,word,txt,pdf等等进行有意的依照固定文本字节长度(10-20)递推的进行指纹数据计算,则可以算出,该文件的内容的数字指纹,进而进行比对。以发现重复内容。
这样生成的指纹,肯定是比较准确的。

没有评论: