这项专利授权公告号为CN1924858B,是搜狗被侵犯的八项专利中申请时间最早的一项,申请于2006年8月9日,并于2010年5月12日获得授权。虽然只是一项后台技术,但这可以说是搜狗输入法使中国网民的输入体验发生飞跃的关键技术之一。其专利名称为“一种获取新词的方法、装置以及一种输入法系统”,通俗来说,就是“新词发现”。
专业点说,这是通过机器抓取用户输入行为,识别出用户个性字词(可以区别于现有字词),将符合预置条件的用户个性字词识别为新词,并保证排在候选语汇第一位或前几位。通俗说来,就是当网络上出现新的“热词”或是“流行语”时,比如最早的“李宇春”,最近的“叶良辰”,很快就能被收录到搜狗输入法的词库中,并且排在前列,再也不需要再一个字一个字拣选组合出正确的词汇。这一技术,可以说是真正地改变了中文输入法的面貌。