2007年4月10日

对于google输入法和sogou输入法不吐不快的破事!

 
sogou输入法说google输入法抄袭了它的词库
 
今天和dzhang先讨论了几句这个话题,他支持我写一篇雄文来说清楚这个问题,但是我发现要我写一篇雄文来阐述一个非常清楚的道理,这个道理清楚得如此之清楚搞得我兴趣全无,并且我看到smth上面居然开了一个版面来讨论这个破事,而且里面绝大多数人脑子清楚,并且还有一篇雄文已经从法律上阐明了这个问题,我只能把它贴出来,希望smth的人不要告我未经允许转贴文章,我行走在法律的边缘。
 
在贴出水母牛人的雄文之前,我要呼吁:
 
强烈呼吁商务印书馆的《现代汉语词典》停止对上海辞书出版社的《辞海》的词库的侵权行为!!!
强烈呼吁保护上海辞书出版社的《辞海》的词库的知识产权!!!
 
下面是smth的雄文:
 
受著作权法保护的客体是具有独创性的作品,词或词组是构成文字作品的基本单位,其本身不能成为著作意义上的作品,既使某个词或词组具有独创性,因其不是作品,其创作者不享有著作权。关于这点可以自己去查案例,无论你用谷歌还是搜狗都是可以搜到很多的。虽然我国不是英美法系的国家,但是在实际操作中,案例可以拿来用的。

词库是词语无序的集合(排列顺序,记忆方式那是词频和组词的问题,和词库本身是两回事,不要混淆),词语本身不是著作权法保护的客体,词库同样也不是。如果你要拿小说对比,小说是词语有序的排列,排列顺序是原创性的,所以受保护,而词库不是。很简单的判别方法,我把词库里的所有词随机打乱,他还是这个词库,但是你把小说里的词打乱下看看……

如果说要保护,那么著作权法保护的应该是词频,而不是词库。词频可以确认词库的唯一排列顺序,这个顺序是原创性的,不可打乱的,和小说的组词类似,因此每个输入法都对自己的词频享有著作权,而非词库。

所以说如果谷歌拼音只有词库和搜狗类似,并没有牵涉到版权问题,只有词频一样了才可以算侵权。现在这个状况,就是在未事先告知情况下对他人版权所有的产品中的部分无版权的公共领域内容的重新演绎,至多就是没给搜狗面子而已,和侵权完全没有关系。
 
在牛文之后我加一句,不光保护词频,还应该保护生成词库的方法,比如从网络的网页中的数据挖掘技术。其实输入法的数据挖掘和搜索领域当中的数据挖掘有异曲同工之妙,是IT发展的一个重要领域。

没有评论: