Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2468723
  • 博文数量: 392
  • 博客积分: 7040
  • 博客等级: 少将
  • 技术积分: 4138
  • 用 户 组: 普通用户
  • 注册时间: 2009-06-17 13:03
个人简介

范德萨发而为

文章分类

全部博文(392)

文章存档

2017年(5)

2016年(19)

2015年(34)

2014年(14)

2013年(47)

2012年(40)

2011年(51)

2010年(137)

2009年(45)

分类: 大数据

2016-06-03 08:52:35





================result==================

theano and tensorflow cnn code for insuranceQA

theano code, test1 top-1 precision : 61.5% (see ./insuranceQA/acc) tensorflow code, test1 top-1 precision : 62.6%

the best precision in the paper is 62.8% (see Applying Deep Leaarning To Answer Selection: A study and an open task)

================dataset================

dataset is large, only test1 sample is given (see ./insuranceQA/test1.sample)

I converted original idx_xx format to real-word format (see ./insuranceQA/train ./insuranceQA/test1.sample)

you can get the original dataset from 

word embedding is trained by word2vec toolkit

=================run=====================

reformat the original dataset(see my train and test1.sample)
change filepath to your dataset(see TODO in insqa_cnn.py)
python insqa_cnn.py


阅读(3447) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~