前不久,美国人工智能公司OpenAI发布了旗下首款文生视频模型Sora,持续引发关注。这是继文本模型ChatGPT之后,OpenAI推出的又一款极具颠覆性的AI大模型产品。
近年来,随着人工智能的发展,AI智能领域持续火爆发展,从而出现了许多与之相关的文章和报告。然而,有些读者虽然频繁地接触和阅读各类AI相关的报告,但对于其中的一些专业术语仍然感到困惑和不解。
这些专业术语在AI领域的报告和新闻资讯中屡见不鲜,如果不能准确理解其含义,可能会对AI行业的认知和理解产生误解。因此,对于想要深入了解AI领域的读者来说,掌握这些专业术语是至关重要的。为此,艾媒咨询分析师将通过具体案例来科普一下这些AI领域的专业名词以及从AI各领域应用举例帮助大家更好地理解这些词语。
必知的AI领域专业术语
人工智能(AI):AI是人工智能 (Artificial Intelligence) 的缩写,它涵盖了各种技术和方法,旨在使计算机系统具备感知、理解、学习、推理、决策和交互等能力
通用人工智能 (AGI) :AGI 即 Artificial general intelligence 的简写,与狭义人工智能 (专注于特定任务) 不同,它的目标是实现全面性的智能,具备自主决策和创造性思维。
狭义人工智能(ANI):狭义人工智能 (Artitical Narrow intelligence),即专注于一件事的 Al,比如下围棋的 AlphaGO,又称为弱人工智能。
生成式人工智能(AIGC):AIGC即“Artificial Intelligence Generated Content”的简写,意指由人工智能生成的内容。AIGC是一种全新的内容生产方式,是利用现有文本、音频文件或图像创建新的内容的技术。
算力(computing power):算力通常指的是计算机的计算能力,是人工智能应用中非常关键的因素。在AIGC领域中,需要大量的算力来训练和优化模型。
大模型:大模型通常是指参数量非常大的深度学习模型,如Transformer架构的GPT-3、BERT、T5等模型。这些模型通过在海量数据上进行训练,能够学习到丰富的语言和知识表示,并展现出强大的自然语言处理能力。
提示词/提示语(Prompt):Prompt指的是向AI模型发出的一种指令,用于引导AI模型按照人类的要求完成特定的任务,如生成文件、翻译、回答等问题。
大语言模型低阶自适应(LoRA):LORA的全称是Low-Rank Adaptation,即大型语言模型的低阶自适应。LORA大大降低了适用于特定任务的大型语言模型的存储需求,并在部署期间实现了高效的任务切换,而不会带来推导延迟的问题。
多模态(Multimodal):多模态指的是涉及多种感知模式或数据类型的任务或系统。在多模态任务中,系统需要同时处理和整合来自不同感知模态的信息,例如图像、文本、语音等。
自然语言处理(NLP):计算机对自然语言的处理,包括语音识别、自然语言理解和生成等任务。
人工智能公司及其AI大模型/应用
2023年被公认为是“大模型元年”,国内外大模型层出不穷,堪称“百模大战”。在这场竞赛中,各大企业和研究机构纷纷亮出各自的绝技,推出的大模型各具特色,犹如百花争艳。
【OpenAI】
介绍:OpenAI是一家位于美国的人工智能研究公司,旨在创建造福全人类的安全通用人工智能。OpenAI在人工智能领域取得了多项重要进展,发布了著名的生成式大模型ChatGPT和文生视频大模型Sora。
ChatGPT:ChatGPT是由OpenAI开发的语言模型,用于自然语言处理和文本生成任务。它能够基于在预训练阶段所见的模式和统计规律来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。
Sora:Sora是OpenAI推出的一款文生视频大模型,其全称为Synthetic Video Generation,意为合成视频生成。该模型可以根据用户输入的提示词、文本指令或静态图像,生成长达一分钟的视频。这些视频不仅具有高度的视觉质量和连贯性,而且能够实现多角度镜头的自然切换,包含复杂的场景和生动的角色表情,同时保持故事的逻辑性和连贯性。
【微软】
微软在人工智能领域有着广泛的布局,包括提供云计算服务、开发人工智能工具和平台,以及推动人工智能技术的研究和应用。微软的人工智能产品和服务涵盖了多个领域,如智能助理、自然语言处理、机器学习等,致力于为客户提供高效、便捷、智能的解决方案。微软是全球人工智能领域的重要参与者之一。
MT-NLG:微软(Microsoft)推出的大模型是MT-NLG(Multi-Task Natural Language Generation),这是一款基于Transformer架构的自然语言生成模型,旨在提高多任务场景下的自然语言生成能力。MT-NLG模型拥有数十亿个参数,可以在各种语言生成任务中表现出色,如文本摘要、对话生成、机器翻译等。该模型使用了多种技术来增强其性能,包括多任务学习、自监督学习等。
【百度】
百度(Baidu)是中国最大的互联网搜索引擎和技术公司之一,致力于为用户提供最智能、最便捷的互联网服务,包括在线广告、搜索、在线媒体、移动服务、云计算和人工智能等。作为全球领先的人工智能平台型公司,百度在人工智能领域持续投入,拥有深厚的技术积累,并在语音识别、自然语言处理、图像识别、知识图谱等核心技术方面取得了重要突破。
文心一言:文心一言是百度基于文心大模型技术推出的生成式对话产品。它能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
【阿里巴巴】
阿里巴巴早在2015年就开始发力,成立了首个人工智能实验室,并陆续推出了包括可视化人工智能平台DTPAI在内的一系列创新产品。阿里巴巴利用自身的云计算和大数据优势,成功将人工智能引入到淘宝、天猫等核心平台,并在物流、金融、医疗等行业实现了广泛应用。
通义千问:通义千问是阿里巴巴集团推出的一款大型预训练语言模型。通义千问的功能非常广泛,可以应用于金融、医疗、教育、物流等各个行业和领域。它不仅可以回答常见的问题,还能处理复杂甚至少见的问题,致力于满足用户在不同场景下的需求。
【京东】
京东在人工智能领域的布局主要集中在自然语言识别、图像识别、智慧物流、智慧供应链以及金融科技等方面。京东通过自主研发和技术创新,不断深耕这些领域,旨在铸造“可信赖的AI”。京东人工智能的技术实力已经广泛应用于智能零售、物流仓储、智能服务、智能城市等数智供应链场景,为用户和商家提供更加智能、高效的服务。
言犀大模型:京东推出了言犀大模型,这是一个融合70%通用数据与30%数智供应链原生数据的大模型,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
【科大讯飞】
科大讯飞股份有限公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,拥有世界领先的智能语音技术,并在语音合成、语音识别、口语评测、自然语言处理等多项技术上拥有国际领先的成果。
星火认知大模型:科大讯飞推出了星火认知大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。讯飞星火认知大模型具备七大维度能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。