Chinaunix首页 | 论坛 | 博客
  • 博客访问: 128096
  • 博文数量: 153
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 882
  • 用 户 组: 普通用户
  • 注册时间: 2022-03-12 10:39
个人简介

不积小流,无以成江海。

文章分类

全部博文(153)

文章存档

2023年(50)

2022年(90)

我的朋友

分类: IT业界

2023-07-10 09:57:12

1、LLM



内容概要:

先泛泛的介绍 大语言模型 的概念性名词

然后,通过概念性名词 深入到 LLM 的专有性名词 或者说 功能性名词

接着,通过 专有性名词 的功能作用 窥探 大语言模型的执行过程

再然后,粗读一篇 大语言模型的始祖论文《A Neural Probabilistic Language Model ,Yoshua Ben etc 2003》

{BANNED}最佳后,有什么补充的再补充吧


本节内容摘要

这一节主要是了解什么是 LLM、NLP 以及 NLP 神经统计方法。

{BANNED}最佳重要的是了解三者的关系:

  • NLP 包含 LLM;
  • LLM 包含 NLP 神经统计方法;
  • NLP 神经统计方法 包含 chatGPT;

上述如果都懂了,请看下节内容。

LLM

在计算机科学领域中,LLM 代表"Large Language Model",指的是大型语言模型。

这种类型的模型是基于机器学习和自然语言处理技术构建的,可以理解和生成自然语言文本。

所以,LLM 的基础是 机器学习 和 自然语言处理 两种技术。

NLP

NLP 是自然语言处理(Natural Language Processing)的缩写。

自然语言处理是计算机科学和人工智能领域中与人类自然语言(如英语、中文等)相关的理解、生成和处理的技术和方法。

NLP 的目的:使计算机能够理解和处理人类语言的各个层面,包括语义、语法、语境和语用等。 它涵盖了广泛的任务和应用,包括但不限于文本分类、情感分析、命名实体识别、机器翻译、问答系统、对话系统、文本摘要、信息提取、语音识别等。

LLM 与 NLP 的关系

LLM 是 NLP 领域中的一种特定类型的语言模型,通常是基于深度学习技术的大规模预训练模型。

NLP 神经统计方法

NLP 神经统计方法 是近年来 NLP 领域中非常重要的一种方法论,它结合了深度学习(尤其是神经网络)和统计方法,以从数据中学习语言模型。

神经统计方法 将语言建模作为一种统计过程,尝试从大量的语言数据中学习到语言的统计规律和模式。

在传统的 NLP 方法中,很多任务(比如分词、词性标注、句法分析)都需要大量的人工制定规则或人工标注数据。然而,这些方法在面对复杂的语言现象和大规模的语料时往往力不从心。

神经统计方法,尤其是近年来的预训练语言模型(如 BERT、GPT 等),能够在大规模未标注数据上进行预训练,学习到丰富的语言知识,然后再针对特定任务进行微调,大大提升了 NLP 任务的效果。

什么是语言模型,什么是 BERT、GPT ,什么是预训练,之后都会有介绍。

NLP 神经统计方法 和 NLP 的关系

神经统计方法 可以看作是一种语言学习模型的实例。

NLP 的神经统计方法是一种 LLM 的实现方式。

原因如下:

神经统计方法在 NLP 中是一种使用神经网络来理解和生成文本的方法,这涉及到学习语言的统计规律和模式。比如说词嵌入(word embeddings)、循环神经网络(RNN)、长短期记忆网络(LSTM)、变压器模型(Transformer)、BERT、GPT等,都是神经统计方法的具体应用。

LLM 是 Language Learning Model 的缩写,代表语言学习模型,这是一种利用机器学习算法来学习和理解语言规则的模型。神经统计方法可以看作是一种语言学习模型的实例。通过神经网络,模型可以从大量的语料中学习语言的统计规律,这种学习过程可以看作是一种语言学习。

总的来说,NLP 的神经统计方法是一种 LLM 的实现方式,使用神经网络和大数据来学习和理解语言。LLM是一种更广泛的概念,可以包括使用各种机器学习方法(包括但不限于神经网络)的语言模型。

阅读(630) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~