搜狗实验室

搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,包含创意产品、原型演示、资料下载、学术论文四个栏目。我们期望通过这个平台,展现搜狗研发团队强大的研发、创新能力;推动学术界和产业界的交互;了解用户对新产品的需求。我们的目标:为中文网民的互联网生活提供更加全面、更加优质的服务。

我们会在“官方博客”和“搜狗实验室吧”与搜索引擎爱好者和广大研究人员展开交流。

资料下载:(SogouE搜索评测数据发布!)
上百G的独家资料,给您一个真实全面的互联网。
  • 搜索评测集合NEW!对应SogouT2.0网络语料库的检索评测集合
    版本:v1.0    发布时间:2007/10/30    项目进展: 100%
  • 用户查询日志2007年3月,搜狗所有网页查询需求及用户点击情况的网页查询日志数据集合。
    版本:v1.1    发布时间:2006/11/02    项目进展: 100%
  • 互联网语料库包括近100,000,000张网页数据的网页语料数据集合。
    版本:v2.0    发布时间:2007/03/10    项目进展: 100%
  • 链接关系库包括对应互联网语料库内文档的链接关系列表。
    版本:v1.0    发布时间:2006/12/15    项目进展: 100%
  • 网络图片库包括16万张图片及其自动标注数据的数据集合。
    版本:v1.0    发布时间:2006/12/15    项目进展: 100%
  • 互联网词库基于互联网语料环境的高频词对应的词频、词性信息。
    版本:v1.0    发布时间:2006/11/02    项目进展: 100%
  • 中文词语搭配库基于互联网语料环境的词(字)与词(字)之间的搭配关系统计信息
    版本:v1.0    发布时间:2006/11/02    项目进展: 100%
  • 文本分类数据基于搜狐分类目录手工编辑的网页分类结果组织成的网页、分类结果及基准分类算法在内的综合数据集合。
    版本:v1.0    发布时间:2006/11/02    项目进展: 100%
创意产品:
研发人员利用网页搜索核心技术模块“拼装”出来的产品,旨在给大家带来更多乐趣。
  • 搜狗拼音输入法一款基于搜索引擎技术的、特别适合网民使用的、新一代的输入法产品。
    版本:v1.0    发布时间:2006/09/06    项目进展: 100%
    版本:v2.0    更新时间:2007/01/29    项目进展: 100%
    版本:v3.0    更新时间:2007/10/18    项目进展: 100%
  • 搜狗音乐盒NEW!基于搜索引擎技术、P2P下载技术,歌曲搜索、下载、播放一体化、方便快捷的音乐产品。
    版本:v1.0    发布时间:2008/01/04    项目进展: 100%
  • 搜狗博客搜索收录最新最热的博文,快来看看你是否“榜上有名”。
    版本:v1.0    更新时间:2006/12/14    项目进展: 80%
  • 搜索比比看选择一款最适合你的搜索引擎。
    版本:v1.0    更新时间:2007/01/01    项目进展: 100%
  • 搜狗个性首页自己动手制作属于你的个性化首页
    版本:v1.0    更新时间:2007/03/06    项目进展: 85%
  • 历史上的今天搜索引擎“算”出来的历史重要度
    版本:v1.0    更新时间:2007/01/25    项目进展: 100%
  • 搜狗文品指数文品如人品,一样都是品。用文品指数测试你的文学潜质。
    版本:v1.0    更新时间:2006/12/28    项目进展: 100%
  • 搜狗网页评级搜狗衡量网页重要性的指标。
    版本:v1.0    更新时间:2006/09/25    项目进展: 100%
原型演示:
一些核心功能的技术原型演示。
  • 网页自动分类器自动分析网页所属的行业分类。
    版本:v1.0    更新时间:2006/11/02    项目进展: 60%
技术报告:
搜狗研发团队积累的技术文档,Web开发必备参考。
   本文介绍了如何利用流水线和一些锁的技巧提高服务器吞吐量,以及新兴的Lock Free技术。
   32bit应用程序由于寻址空间的限制,无法直接使用4G以上的物理内存, 这对一些性能要求高,内存开销大的应用程序而言是很大的限制。本文介绍了一种在32bit下利用超过4G的内存的方法和相应的实现。
学术论文:
搜狗研发团队公开发表的部分学术论文。
   该研究由清华大学智能技术与系统国家重点实验室与搜狐公司研发中心联合进行,使用了SogouLab提供的网络语料库信息,发表在美国信息科学技术学会会刊上。
   该研究由清华大学智能技术与系统国家重点实验室与搜狐公司研发中心联合进行,使用了SogouLab提供的查询日志信息,发表在2007年度国际互联网大会(WWW2007)上。

意见反馈渠道:

搜狗实验室吧一个与搜狗核心研发团队零距离接触的机会。您可以在这里告诉我们您希望获得什么、您对于实验室建设有什么好的想法创意、您对实验室的现有产品、资料有什么意见建议… …

实验室博客搜狗核心研发团队的官方博客,记录实验室成长的点点滴滴。

在线反馈如果您对结果不满意请与我们联系

拼音输入法 - 工具条 - 实验室 - G邮箱 - 搜狗大全 - 推广服务