作为一个爱好网络文学的现代青年,从诛仙、寸芒、遮天再到诡秘之主,相信很多人和我一样,在看过无数优秀的作品后,都想过或者尝试过写一本属于自己的小说。说来惭愧,我在高中时就在起点签约过一篇小说,但最终因为写不下去断更了,原本信心满满构思的宏大剧情,却只能因为缺乏情节设计而遗憾放弃。而这可能也是很多人跟我一样放弃这个想法的原因。虽然在开头写的很带劲,但没过几章就发现情节全乱套了。
一是能力不足,二是缺少大纲。除非是天赋异禀的大神级作者。一般的小说都需要一个详实、有理有据的大纲,包含了人物背景、主要情节、体系设定等等,有了大纲为骨,才能下笔如风。但这并非一件易事,因为和视频大纲不同,对动辄上百万字的网络小说而言,大纲是更加抽象的东西,只有看过海量作品并加以分析之后才能有所掌握。
而在如今的大模型时代,这正是ai所擅长的东西。今天我就来尝试开发一个可以学习优秀网络小说并自动撰写大纲的a i,看看它能否将我的灵感转换成大纲。首先我尝试了直接使用chat、g p t、word和文馨妍等几个主流大模型来生成大纲。这种做法也是绝大多数国内ai写作工具所使用的,方便简单,但测试下来效果都一般。
国外的通用大模型因为中文语料占比比较少,随着很多国内小说以及汉语文化中的名词语境都不是特别擅长。而文心一言是终于出去训练的对网络小说更了解一些,对于联网大模型效果还是不错的,整合了很多实时信息,但有一说一,仍然没有达到我的预期。生成大纲太过宽泛和简单,我想要的是更具体更贴合小说的答案,直接掉模型走不通。我开始尝试第二种方法,重新训练。
如果把初次预训练看作九年义务教育,让爱学会了基本的知识和理解能力。那么重新训练或者叫微调,就是让它继续深入某个特定领域。在基础能力之上,进一步掌握某个新闻专业的知识。重新训练一般有两种。
一是基于参数量在几十亿的小模型进行本地服务器的微调。比如我曾用过的l帕卡七b或者g l m六b。它的好处是成本较低,但问题在于只能胜任长度较短、逻辑性较低的文本,人物像大纲撰写这类复杂需求是完全没法满足的。第二种就是直接训练千亿参数的大模型。
比如完全体的g p t三可以满足复杂需求,但训练动辄需要几百张显卡的分布式集群,仅算力成本就接近千万,根本承受不起。如果能把两种训练方式结合,自然是最理想的。open a i虽然支持二次训练,但模型本身的中文能力略有不足。而在我印象里,国内似乎还没有这样的应用。
就在我准备放弃时,偶然间想到老朋友差评君之前开发过的一个b站区标题神器。里面就用到了国内的大模型平台进行二次训练。为了实现这个目标,我们选择了百度智能云千帆大模型平台作为我们赛博主编的灵魂。整个开发过程看着并不复杂,也正好符合我对从数据标注到模型调优全流程的开发需求。
一是靠着百度云自身的算力,把千亿级的大模型训练成本降到最低,二是有自带的儿女中文大模型,对于小说的理解能力自然也更强。如此一来,参考差评君的做法,就可以在几乎不需要写代码的情况下,把已有的优秀网络小说整理成数据集,这让大模型重新训练和学习了。选定了训练平台。接下来就是具体开发了。
首先我让a i网友推荐了一百本优秀的网络小说。然后获取每本小说的数据。由于小说字数普遍过长,不能直接喂给大模型。结果先是文心一言为我写了这样一个脚本,简单优化后运行脚本,将每本小说按章节分割,然后让ai用一句话总结每章内容。
最后再融合起来,概括其故事脉络,形成大纲,这样就能生成其对应的训练数据了。接下来就是在训练后台一键创建数据集,上传到千盘平台。由于一些小说数据中有外站网址和特殊符号,为了避免影响性能,可以基于平台自带的数据处理功能来清洗小说数据。待在数据处理完成发布后,最后一步就是训练了模型选择。
上千盘平台集成了国内外主流的四十四个大模型,比如lama film等,非常全,乍一看有点不太好选。不过因为我们这次要训练的是中文。这些模型中,只有anne作为文心一言的核心底层模型,使用了大量中文数据,训练中文能力是最符合我们需求的。选好模型就可以提交数据集运行任务,然后等待训练完成。
训练集群是部署在飞讲的平台上,也提供了可视化的训练过程。而完成训练后,就可以选择对应模型发布服务,然后在切换平台一站式部署。基于自带的百度云算力服务,可以很方便的在线生成。值得一提的是,整个流程都是交互式的,官方文档也非常详细,并没有遇到太多问题。
在服务中还可以结合文心自带的搜索插件,让a i联网学习,补充一些数据中没有的细节。接下来就让我们尝试着生成一些大纲,看看模型效果如何。综合来看,学习了大量优秀网络小说后的a i所展现的效果也比调用接口的原生大模型要好不少。虽然略有瑕疵,但逻辑和思路都相当清晰,有的甚至可以直接拿来用。
而截止视频发布前,千帆也在世界大会上发布了全新升级,接入了更强大的文心四点零,带来了更多有趣的功能,后续我也会继续体验和开发。其实无论是取标题还是撰写大纲。我们也只不过刚接触到了a i g c的一次门槛。这个领域仍旧处于发展中。
未来五年将会带来新的变革。这让我们有了远离繁杂重复工作的可能,同时也将创意与创作分离,让我们可以更加聚焦于人类独有的灵感。就像是马良手中那根神笔,在a i的辅助下,我们可以完成过去只存在于脑海中的幻想。无论它是小说、绘画、歌曲还是游戏。
我想这也许正是技术发展的真正意义。丢失的风算什么?