大模型应用越来越广泛,而大模型的使用最主要的方面就是提示词的应用,可以说提示词用的是否熟练直接影响最终大模型的使用效果
1.大模型概念
构建AI大语言模型的第一步是收集大量文本数据。这些文本数据可以来自各种资源,包括书籍、学术论文、新闻文章、网站,甚至是社交媒体上的帖子。这些文本数据就像原材料一样,为模型提供了大量的知识和信息
收集到数据后,下一步就是训练模型。在训练过程中,模型会阅读所有文本数据,并尝试学习语言的模式和结构。这个过程可以看作模型在尝试理解语言的“规则”。训练模型的一个常用方法是使用一种称为自监督学习的技术。在自监督学习中,模型会被给予一个输入(如一个句子的一部分),并被要求预测一些输出(如这个句子的下一个词)。通过这种方式,模型可以学习到语言的各种模式,如词语的顺序、语法规则,甚至一些更复杂的概念,如讽刺和比喻。
训练过程中,模型的参数会被不断调整,以便更好地从数据中学习。如果模型预测一个句子的下一个词是“狗”,但实际上下一个词是“猫”,那么模型的参数就会被调整,使得下次再遇到类似情况时,模型能够做出更准确的预测。这个训练过程需要大量的计算资源,并且可能持续数周或数月。在这个过程中,模型的参数会被调整数万亿次,直到模型能够尽可能准确地预测输出结果。
近几年,随着计算能力的提升和数据量的增加,AI大语言模型变得越来越大、越来越强。AI大语言模型的能力随参数量的增加而不断增强。例如,2024年4月Meta公司(原Facebook公司)发布的Llama3最大支持4000亿个参数,而ChatGPT-4据说拥有1.8万亿个参数!这些参数就像金字塔的细部结构,它们决定了模型理解和生成语言的具体方式。
2.大模型应用场景
1. 事实查询
2. 翻译写作
3. 技术培训和教育辅导
4. 创意辅助
5. 代码生成和软件开发
6. 路线规划旅行建议
。。。。。
3.大模型具有什么样的特性
1. 输出的不稳定性
2. 回答可能不准确
3. 幻觉现象
在某些情况下,AI大语言模型可能会出现幻觉,即生成一些与现实不符的内容。这是因为AI大语言模型在生成语言时,不仅会从自己的知识库中搜索答案,同时还会考虑语言的逻辑结构,因此,如果模型认为一种情况虽然不太可能,但是在语言上是十分合理的,为了“讨好”提问者,它可能会努力生成这种内容,产生“一本正经地胡说八道”的效果,这种情况出现的时候很难察觉,因为模型的回答结构完整、用词准确,让你感觉十分有道理
4.提示词的基础概念
精心设计和优化提示词,能让模型更好地理解你的需求,如果你发现AI大语言模型的回复有点傻,这可能并不意味着AI大语言模型的能力无法满足你的需求,反而更可能是因为你没有使用精确而有效的提示词来唤醒AI大语言模型的全部潜能
举例:比如问一个人说“我的手机屏幕最近老是自动变暗,是什么原因”,如果人来回答,可能是“最近这么热,今天甚至快40℃了,你坐在窗户旁边让阳光直射手机,而且苹果手机对温度挺敏感的,温度高了会自动调低屏幕亮度。你把手机放到空调旁边吹吹看吧。”,如果是ai模型,应该是列举所有可能,泛泛而谈,此时就是提示词不够具体
虽然AI大语言模型在不断进步,但在短时间内,我们可能难以脱离提示词的技巧
5.提示词的分类
1. 续写性提示词
输入:猫是
输出(ChatGPT-3.5):猫是一种哺乳动物,属于猫科动物,常被人们作为宠物饲养。猫的特征包括柔软的毛发、敏捷的身体、锐利的爪子和牙齿及独特的听觉和嗅觉能力。猫通常是夜行动物,喜欢独自行动,但也可以与人类建立亲密关系。猫在人类历史上一直扮演着重要的角色,如守卫粮仓、捕鼠等。
输入:忙碌的生活总是
输出(豆包):分享忙碌的生活总是让人在疲惫中寻找意义,在奔波里渴望停歇。它像是一首节奏紧凑的乐章,每个音符都带着匆忙的韵律,让人来不及细细品味其中的酸甜苦辣,便又被推向下一个节拍;忙碌的生活总是充满了各种挑战与机遇,在不经意间,我们收获了成长与蜕变,却也在时光的缝隙里,遗失了那些简单的快乐;忙碌的生活总是在推着我们不断向前,让我们无暇顾及身边的美好风景,待我们蓦然回首,才发现那些被错过的瞬间,早已成为了记忆中珍贵的碎片。
与一些人理解的不同,AI大语言模型的本质是“文本续写器”。它的根本任务是根据你输入文字的内容按规律续写最可能的下文。我们所熟悉的“提问-回答”模式,只是续写的其中一类。对于AI大语言模型而言,你是否提出一个问题并不重要,重要的是AI大语言模型会寻找哪些文字最适合“接”在你所写的文字的后面,使得上下文连接流畅、符合行文逻辑
2. 指令型提示词
在“续写型提示词”中,我们曾使用“猫是”举例。现在,假如你希望AI大语言模型将“猫是”补全为一句话而不是一大段话,我们就需要给予AI大语言模型更多的“提示”。我们来实现这个目标。输入:补充下列句子中残缺的成分:“猫是”。
输出(豆包):猫是一种好奇心极强的动物,总是对周围的新事物充满探索的欲望
3. 疑问句提示词
1+2等于多少?
由于提示词可以由任何文本组成,甚至不要求是一个完整的句子,因此,提示词从本质而言是没有什么固定格式或语法的。但是,随着使用的提示词越来越多,你可能会注意到,大多数提示词可以被分为几个部分。在这里,我们给大多数提示词中共同存在的几类成分起个名字,以方便后续的使用。一个提示词可以包含以下任意一个或多个成分。
(1)指令(Instrument):这是你希望AI大语言模型执行的具体任务或指令。
(2)上下文(Context):历史情况、环境信息和前后对话等附加上下文,可以引导模型理解更具体的情景,做出更好的响应。
(3)输入数据(Input Data):我们感兴趣或将要进行处理的具体数据或问题。
(4)输出指示器(Output Indicator):输出的类型、格式和附加要求。并不是每个提示词都拥有上述每个成分。一个提示词具体拥有哪些成分取决于当前的任务
6.提示词的基础技巧
基础技巧不详细展开,以下只列举一些:
1. 充分提供信息,让大模型更懂你
2. 精准用词,减少大模型的误解
3. 角色扮演,让模型更专业
4. 分布提问,循序渐进解决问题
5. 把大模型当百科,充分利用大模型知识库
6. 列举一些例子,让大模型秒懂你的意思
7. 多维度提问,让大模型发散思维
8. 分布推理,提高大模型逻辑能力
9. 使用Markdown格式,长篇文章不在话下
10. 输入输出结构化
输入:把下面这句话翻译成英语:请把下面这段话翻译成德语。
输入:把冒号之后的句子翻译成英语:请把下面这段话翻译成德语。
11. 迭代式提问,发挥模型潜力
12. 自我一致性,大模型自我纠错
历史事件:假设你问AI大语言模型:“‘二战’是在哪一年结束的?”AI大语言模型可能会回答:“‘二战’在1945年结束。”为了验证这个答案,你可以再问:“纳粹德国在哪一年投降?”通过对比两个答案,你可以验证AI大语言模型的准确性。
13. 重复提问,精益求精
7.提示词进阶技巧
1. 使用先验知识,避免幻觉现象
约翰·霍普金斯大学的研究人员发现了一种简单的技术,可以减少AI大语言模型中的幻觉,提高答案的准确性。这项技巧就是使用“根据”(according to)这个关键词。通过在提问中加入“根据”这个关键词,AI大语言模型被引导着将回答与先前观察到的文本进行关联,而不是产生虚假的回答。这种方法使得AI大语言模型更有可能直接引用请求的来源,就像记者引用消息来源一样。
AI大语言模型非常擅长遵循语法和语义线索,由于“根据”这个关键词在新闻文章引用消息来源时更有可能出现,AI大语言模型可能会将这个提示视为从其训练数据中搜索引用的线索。根据研究团队的测试,当查询使用类似“根据”的提示词时,信息引用准确率指标提高了5%~15%。而且,不同的AI大语言模型对此都表现良好。这一发现有助于提高AI大语言模型回答的可信度和准确性,并减少系统产生虚假信息的情况。
2. 使用大模型的母语提问
就是gpt用英文,国产用中文
3. 提示词逆向,让大模型帮你想提示词
输入:###分析以下文本,给出可以生成这个类型文本的完整的Prompt(提示词) ,包含文本的类型、文风、角色、风格、语气、长度、段落和emoji等内容。请直接输出结果,不要输出其他内容:###【热门推荐】摇滚新星!感受青春狂热的《雷霆之音》 。推荐指数:(5/5)嗨,宝贝们~今天给你们带来一首绝对让你们血脉偾张、心跳加速的当下流行摇滚音乐!歌曲名称: 《雷霆之音》演唱者:热血摇滚乐队“炽焰少年”评分:10/10简介:这首《雷霆之音》是由“炽焰少年”乐队创作的一首摇滚金曲,让人沉醉于无尽的能量和激情之中。这支年轻的乐队以独特的音乐风格和澎湃的演出赢得了无数乐迷的心。他们将摇滚的力量与现代元素相结合,创造出一种新的音乐体验。这首歌曲的吉他独奏简直让人发狂!强烈的节奏和迷人的旋律让人感受到音乐的力量,仿佛置身于狂热的演唱会现场。每次的鼓点敲击都像是心脏的跳动,让你的血液沸腾起来。 “炽焰少年”的主唱声线凌厉有力,伴随着激情四溢的歌词,唱响了年轻人的心声。这首歌的旋律和歌词充满了对自由、梦想和青春的热爱。它是一首勇敢追逐梦想的赞歌,让我们勇敢面对生活中的挑战,追求自己的理想。每次我听到这首歌,就仿佛置身于那个无拘无束的年轻时光,感受自己内心深处的力量和勇气。我相信这首歌会深深触动你的心弦,让你感受到摇滚音乐的魅力。它不仅仅是一首歌曲,更是一种态度,一种对生活的热情。让我们一起跟随《雷霆之音》的节拍,释放内心的激情,勇敢追逐自己的梦想!标签:#摇滚音乐 #炽焰少年 #青春激情 #梦想追逐
输出:
文本类型:音乐推荐文案
文风:活泼、生动、富有感染力
角色:音乐推荐者(以亲昵、热情的形象面向听众)
风格:流行且充满激情,带有较强的情感渲染
语气:兴奋、激动、热情洋溢,充满推荐和引导的语气
长度:较长,约 500 字左右
段落:包含标题(含推荐指数)、开场问候与引入、歌曲基本信息(名称、演唱者、评分)、歌曲简介(创作团队、风格特点、乐器表现、主唱特色、歌词内涵)、个人感受与评价、呼吁与总结、标签
emoji:无(可适当添加如🎶、🔥等)
Prompt:以活泼生动、富有感染力的文风,站在音乐推荐者的角色,用兴奋激动、热情洋溢的语气,写一篇约 500 字左右的音乐推荐文案,包含标题(带上推荐指数),开场要有亲昵的问候,然后介绍歌曲名称、演唱者、评分,接着详细描述歌曲的创作团队、音乐风格、乐器演奏亮点、主唱特色、歌词内涵等,再谈谈自己听后的感受和评价,最后进行呼吁和总结,并带上 #摇滚音乐 # 炽焰少年 # 青春激情 # 梦想追逐等标签,可适当添加音乐、火焰等相关 emoji 。
4. 选择合适的大模型
中文:deepseek,豆包,元宝,通义,子曰
英文:GPT,Gemini,LLaMA,Claude,Copilot
图像:Stable Diffusion 系列
参考资料-《学会提问,驾驭AI》作者:程希冀