月初,我发布了用人工智能预测二零二四高考作文题,目前公布的六套题里,完全命中的有四套。看了我们预测视频,然后他是做素材备考的,小伙伴们现在是不是在偷着乐呢?几年前我们开发了一个探索性的a i项目,利用a i去学习优质作文数据,然后根据命题生成高考满分作文,并在二一年和二二年的多份高考作文题上进行了尝试。而随着g p t模型的迭代,像写作文之类模式化文本创作对于很多大模型来说都已经不在话下了。
随便一个网页聊天机器人就能写得八九不离十。为了更好的评估a i的能力边界,今天我们决定反其道而行之,转向更独特而且更具挑战性的角度,那就是测试a i生成零分作文的能力。你也不爱在实际开发过程中,我们发现这个目标比想象的要困难许多。
主要有两个问题,首先是缺乏真实可靠的零分作文样本。网络上流传的所谓零分作文大多未经验证,官方也没有明确的数据,所以真实性有待商榷,难以作为有效的训练资料,因此十分考验a i对于高考作文写作和判分规则的理解。我们的解决方案是通过s f t微调和free shout样本训练来提高模型对这一特定任务的性能。
其次,主流大模型目前是不分级的,全都内置了严格的过滤机制。旨在预防不良内容的生成,从而维护技术使用的正面性。这意味着我们在开发应用时,只能想办法用指令绕过限制,尽量消除a i的限制器。
解决了以上两大问题,接下来我们就选择今年高考话题度最高也最有意思的几个命题来试一试。用我们训练的a i去写一些零分作文,而这些作文是不是真的符合零分作文的标准,就留给屏幕前的各位阅卷老师了。大家可以在弹幕打分,也欢迎在评论区留下你的用户评价。
没。今天我打碎胡子,批东西,摩擦子,要走的领风起来。娘娘。
喵喵喵喵喵喵喵。你还。失落的想。
的约定。即便月星星。究竟?菊花台上的。
每一次。想在。天上的。
当然正如前文所说,不管是满分还是零分,本质上都是图一乐。而为了给大家图这一乐,我们也花费了不少时间去开发。喜欢的话别忘了给个三连支持一下。
其实在我看来,零分作文是对a i理解力和创造力的小小尝试。而我们在测试过程中也发现了当前a i写作能力的局限性,尤其是对于现实议题的深刻剖析,以及对丰富细腻情感的描绘和带有批判性思维的文章。所以未来的中文大模型还有很多可以优化的空间。
而和a i一样,大家需要时刻培养敏锐的观察力和深入的思考习惯,让自己的思辨与创作更加精进,才能准确捕捉生活点滴,享受美的思想必然指向了时刻。在后续的图灵计划中,我们还会结合国内的ai工具开发,诸如a i志愿填报等等,更多能帮助到大家的公益性质a i感兴趣的话别忘了关注。最后也祝愿所有学子能够得偿所愿,梦想成真。