互联网验证码的新用途
大多数互联网用户都熟悉那些在他们进入特定网站时要看懂的扭曲字母或数字.卡内基梅隆大学(CarnegieMellonUniversity)发明了这种被称为“验证码”(Captchas)的东西,它被当作一种安全措施——把能看懂这种扭曲字体的人类,与其它电脑区分开来.
现在卡内基梅隆大学的科学家们发现,他们的这一发明还有其它用途——将计算机革命前出版的书籍和报刊数字化,使它们能够被索引、搜索并存储为在线文本.
这些老旧的文本通常模糊不清,多达20%的字无法被光学字母识别(OCR)软件读取.人工辨认这些文本将耗资巨大,除非将它们用于安全字谜——卡内基梅隆将之称为“再验证码”(reCaptchas)——互联网用户将免费进行辨认.
卡内基梅隆大学教授路易斯•范•安(LuisvonAhn)表示,在第一年的运作中,被解答的再验证码超过12亿,被辨认出的字超过4.4亿.他表示:“我们证明,我们能够利用人类可能会白白浪费掉的处理能力,并引导其去完成电脑尚无法处理的任务.”