随着科技的进步,先进的机器学习(ML)产品已经成为通用内容创作工具的代表。其中,ChatGPT作为一款由大型语言模型(LLM)GPT-3.5驱动的聊天机器人,引起了广泛的关注。LLM是一种能够执行各种自然语言处理任务的机器学习模型,包括识别、总结、翻译、生成文本、回答问题以及进行对话等。由于ChatGPT能够根据用户的询问生成新的内容,它被归类为生成式人工智能的工具。
生成式人工智能用于内容创作
ChatGPT于2022年11月30日由OpenAI推出,迅速成为引人瞩目的现象。仅仅在5天内,超过一百万人报名试用这款产品。随后,在2023年2月7日,谷歌发布了类似于ChatGPT的Bard聊天机器人。Bard是基于谷歌的自然语言处理模型LaMDA(Language Model for Dialogue Applications)构建的。与此同时,微软也推出了一款新的Bing聊天机器人,作为对ChatGPT和Bard的竞争对手。
除了生成类人对话,ChatGPT和其他类似的人工智能聊天机器人还可以撰写文章、编写计算机代码、制定食谱、购物清单,甚至创作诗歌。虽然一些聊天机器人的回答中存在不准确和不连贯的问题,但普遍认为,这些人工智能聊天机器人的表现要明显优于过去的非人工智能聊天机器人。
除了ChatGPT、Bard和Bing聊天机器人生成文本回复外,DALL-E、Midjourney和Imagen可以根据用户输入的文本生成图像。Make-A-Video可以生成符合文本描述的视频,而MusicLM则可以生成音乐。GitHub Copilot则可以输出计算机代码,被用作协作编程工具。这些人工智能工具正以越来越快的速度向公众介绍生成式人工智能。
生成式人工智能的定义
生成式人工智能指的是采用深度学习算法生成各种形式的新内容,包括文本、图像、视频、音频和计算机代码等。由此生成的新内容可以是对参考问题的回答,对所提问题的逐步解决方案,或是机器生成的艺术作品,只是其中几种可能性。
与任何深度学习模型一样,开发生成式人工智能模型需要大量的训练数据、大量的参数和大量的计算能力。GPT-3中最大的模型使用了大约45TB的压缩纯文本数据,相当于约100万英尺的书架空间,或者美国国会图书馆馆藏的四分之一。这些例子表明,开发像GPT-3这样的生成式人工智能模型需要大量的资源和高昂的成本。
人工智能在科学研究中的应用
人工智能和机器学习不仅在通用内容创作工具领域取得了巨大进展,还在科学研究领域得到了广泛应用。其中一个明显的例子就是DeepMind开发的AI程序AlphaFold。DeepMind是一家开发AlphaGo的公司,该公司在2016年通过击败18次世界冠军李世石而成为头条新闻。
AlphaFold以蛋白质的基因序列为输入,并输出其3D蛋白质结构的预测,准确性令人印象深刻。2021年7月,DeepMind宣布他们使用AlphaFold预测了几乎所有人类蛋白质的结构,以及其他20种广泛研究的生物体,如小鼠和大肠杆菌的“蛋白质组”。一个蛋白质组是指一个生物体(如一个物种或一个特定的器官)制造的所有蛋白质的完整集合。
与欧洲分子生物学实验室的欧洲生物信息研究所(EMBL-EBI)合作,DeepMind发布了基于AlphaFold的200多万个蛋白质结构预测,并免费提供给科学界。这些预测包括几乎所有已知的目录蛋白质。AlphaFold的意义在于蛋白质通常会折叠成复杂的3D结构,甚至彼此形成复合物,在细胞中执行特定的功能。因此,能够预测蛋白质组的3D形状在生命科学研究中具有重要价值,尤其是在药物发现领域。
除了生命科学和进化生物学,机器学习技术还被应用于许多其他领域,如人类学、天文学、天体物理学、化学、工程学和气象学等。
https://www.infotoday.com/cilmag/jul23/Kim--ChatGPT-and-Generative-AI-Tools-for-Learning-and-Research.shtml
文章来自ChatGPT3.5