一些为四两用户精心挑选和准备的关于AI方面的资讯和建议
作为一个互联网人/建站工/科技工作者,从2023年2月底开始,我(很多人也有这样的感觉)就进入到一个神奇且兴奋的状态。
这种感觉就是哥伦布发现新大陆后,那时的人们开始了很长一段时间的视听盛宴,全新的人种,奇特的动物,怪异的植物,新的海岛,新的大陆,新的文明,新的知识,等等,各种新事物就通过不同渠道出现在那时的人们面前。
我猜那时的人们是幸福的,那时年轻人的眼睛是发光的。而最近这段时间,我似乎能感受到大航海时代初期的样子,N多新事物新创造新科技在很短时间内同时喷发,那个场景太壮观太美丽。这是理工男的春晚,是科技爱好者的Super Bowl中场秀,是互联网人的巴黎时装周。
大盛世,新时代。这个百花齐放的精彩谁不应该错过,一起来围观哟。
所以,为了帮助那些平时忙着接订单谈生意,但对AI感兴趣,却苦于没时间的VIP们和老板们不至于掉队太远。下面这些内容可以简单快速带大家对AI有一个比较新比较大框架的了解,至少对一些重要概念和重要节点要有所了解。
01
名词解释
- AI(Artificial Intelligence,人工智能)
人工智能是指让计算机模拟人类智能的技术,让它们能够像人一样思考、学习和解决问题。 - AGI(Artificial General Intelligence,通用人工智能)
通用人工智能是指一种具有人类所有智能领域的能力的机器。它可以像人类一样在各种任务中学习、理解和应用知识。 - GPT(Generative Pre-trained Transformer,生成预训练变换器)
这是一种先进的人工智能模型,利用大量文本数据进行预训练,然后生成与输入内容相关的文本。例如,根据用户输入的问题生成合适的回答。 - AIGC(AI Generated Content,人工智能生成内容)
人工智能生成内容是指使用人工智能技术,如GPT模型等,自动生成文本、图像、音频或视频等内容。 - ChatGPT(Chatbot Generative Pre-trained Transformer,聊天机器人生成预训练变换器)
ChatGPT是一种基于GPT技术的聊天机器人,它可以理解用户的输入,然后生成自然、流畅和相关的回答。 - Prompt(提示/指令/命令)
在人工智能领域,提示是指向AI系统提供的信息或问题,用于引导AI生成相应的回答或内容。例如,输入一个问题,AI会根据这个问题(提示)生成合适的回答。 - Prompt Engineering(提示工程)
提示工程是指研究和设计有效的提示,以便在与AI系统交互时获得更准确和有用的回答。这包括了解如何构建问题,以及如何利用AI系统的特性来提高回答的质量。
02
重要事件&节点(时间按倒序)
2023.04.04 – Midjourney推出新功能 /describe
这个功能可以让用户上传一张图,然后MJ就可以根据画面反向解析出4条图片描述(也可以理解成4条prompt)。
这就是意味着继text-to-image之后,image-to-text 开启序幕。
2023.03.23 – ChatGPT插件系统
OpenAI开放插件的目的是绑定开发者生态,把自己打造成互联网新的操作系统和流量入口。
你可以这样对比来理解:
- Apple -> OpenAI
- iPhone -> GPT-4
- iOS -> ChatGPT
- Apple Store -> ChatGPT插件
OpenAI 设计的插件系统是我这辈子见过的最疯狂的系统。如果你要给它写插件,你并不是去写这个插件的程序,你是写一个关于插件的描述,用你的自然语言,然后 GPT 来帮你生成这个插件
—— 行业资深玩家
- ChatGPT插件公告及报名表:https://openai.com/blog/chatgpt-plugins
- ChatGPT插件开发文档:https://platform.openai.com/docs/plugins/introduction
2023.03.21 – Google Bard开放公测
这句值得品味,我觉得把Bard定位成这样的角色是比较健康的:
your creative and helpful collaborator, here to supercharge your imagination, boost your productivity, and bring your ideas to life.
你的创造力助手和贴心合作者,旨在激发你的想象力,提高你的工作效率,并让你的创意变为现实。
2023.03.21 -NVIDIA GTC2023 发布会
我们正处于 AI 的 iPhone 时刻!
英伟达黄仁勋在发布会中多次表示和强调。简单说就是他们为AI在硬件(GPU)上准备了一揽子的产品和方案,性能提高几十倍,价格便宜十倍,里外里就是几百倍。
2023.03.21 – Adobe Firefly
Adobe作为世界最大的软件公司,在北京时间凌晨 4 点召开发布会,发布了自己的生成式设计工具 beta 版本的内测链接,firefly.adobe.com,算是对目前图片编辑相关生成能力的集大成了。
2023.03.18 – Midjourney V5 发布
Midjourney宣布了第5版商业AI图像生成服务,这是自去年推出以来的最大更新,也是目前市面上最先进和最强大的AI图像生成器之一。MJ5在画质、细节、风格等方面都有显著提升,甚至可以正确渲染手掌等难度较高的部位。
2023.03.14 – Office Copilot
3月16日晚,微软正式宣布推出Microsoft 365 Copilot。Copilot在民航中是副驾驶的意思。Copilot 用于辅助用户在 Microsoft 365 应用和服务中生成文档、电子邮件、演示文稿等,由 OpenAI 的 GPT-4 技术驱动,像一个助手一样出现在 Microsoft 365 应用的侧边栏,作为一个聊天机器人,让 Office 用户可以随时召唤它,在文档中生成文本、根据 Word 文档创建 PowerPoint 演示文稿,甚至帮助使用 Excel 中的数据透视表等功能。
2023.03.14 – GPT4到来
OpenAI CEO Sam Altman, aka. ChatGPT之父在twitter发文提出新版摩尔定律,指全球AI的运算量每隔18个月就会提升一倍。
a new version of moore’s law that could start soon: the amount of intelligence in the universe doubles every 18 months
— Sam Altman (@sama)February 26, 2023
2023.03.01 – ChatGPT开放API接口
这是一个重要节点:价格便宜,性能强劲,全球N多应用瞬间接入,全球通电,新时代到来。
03
值得你思考和准备的事情
1 Google对AIGC的立场
在以ChatGPT为代表的AI出来后,Google经过挣扎和思考后,也做了明确地表明了自己的立场表态:
Google doesn’t care if the content is created BY people, as long as it’s created FOR people
这个说明其实已经非常清楚了,内容是真人写的或AI写的已经不重要了,但重要的是内容一定要是为真人而写的。具体分析看下面的文章:
2 Prompt & Prompt Engineering
你或许会觉得好像只需要会说话、会打字,就能让 AI 输出答案,好像不需要什么技术。
的确,如果你只想让 AI 给你答案,你不需要额外做什么,只需要输入文字即可。但如果你想要得到满意的答案,甚至精确的答案。就需要用到 PE 这个技术。
因为人类的语言从根本上说是不精确的,目前机器还没法很好地理解人类说的话,所以才会出现 PE 这个技术。另外,受制于目前大语言模型 AI 的实现原理,部分逻辑运算问题,需要额外对 AI 进行提示(这里你不需要深究原因,暂时先知道这是个问题即可)。
3 一些其他思考和准备
可以看看下面这篇文章的第二部分,虽然那是我对自己的要求和考虑,不过对你也有一些借鉴和启发: