为你写诗 [1]


基于 Tensorflow 实现自动作诗(古诗)机器人。本文是系列文章一,简单介绍 Demo 的使用和数据预处理过程(即是 Tensor 生成过程)。至于 RNN 模型相关,概念好多,对于半路出家的笔者还需要时间扣扣细节,查查资料,以免写出来误人子弟(捂脸)。

插播简讯:今天人机大战,四小时酣战,柯洁不敌阿尔法狗,首战失利,阿尔法狗赢四分之一子。

文本的 Demo 是踩在巨人 Tensorflow 的肩膀上,参考 char-rnn-tensorflow 实现。
相关 Github 源码

版权声明:本文为 frendy 原创文章,可以随意转载,但请务必在明确位置注明出处。


有图有真相:

image


原理


将古诗转成张量 Tensor,使用 Tensorflow 的 RNN 模型进行训练,Flow 起来。


环境


Tensorflow 1.0.1

可参考 [Win 10 安装 Tensorflow 踩坑记](http://frendy.vip/machine-learning/2017/05/20/setup-tensorflow-win10.html)


使用方法


下面是本文 Demo 的使用方法,相关参数可在脚本里自行修改调整。

1. 训练
python3 trainer.py
2. 生成诗歌

2.1 随机生成:

python3 generator.py

2.2 藏头诗生成:

python3 generator.py --prime 执子之手

image


数据预处理


预处理生成 Tensor,这里笔者用大家都熟悉的《悯农》来举例分析:

** reading text file =
^锄禾日当午,汗滴禾下土。谁知盘中餐,粒粒皆辛苦。$
** counter = dict_items([('汗', 1), ('$', 1), ('滴', 1), ('午', 1), ('苦', 1), ('粒', 2), ('。', 2), ('土', 1), ('辛', 1), ('日', 1), ('知', 1), ('中', 1), ('皆', 1), ('当', 1), ('餐', 1), ('禾', 2), ('^', 1), ('锄', 1), (',', 2), ('盘', 1), ('下', 1), ('谁', 1)])
** vocab_size = 23
** chars = ('粒', '。', '禾', ',', '汗', '$', '滴', '午', '苦', '土', '辛', '日', '知', '中', '皆', '当', '餐', '^', '锄', '盘', '下', '谁', '*')
** vocab = {'辛': 10, '滴': 6, '午': 7, '苦': 8, '谁': 21, '粒': 0, '。': 1, '土': 9, '汗': 4, '日': 11, '知': 12, '中': 13, '皆': 14, '当': 15, '餐': 16, '禾': 2, '*': 22, '^': 17, '锄': 18, ',': 3, '盘': 19, '下': 20, '$': 5}
** tensor = [[17, 18, 2, 11, 15, 7, 3, 4, 6, 2, 20, 9, 1, 21, 12, 19, 13, 16, 3, 0, 0, 14, 10, 8, 1, 5]]


欢迎来撩

frendy

It will shine for us...