原理 | 第2页 | 令爷课程-曾确令(ColinZENG)AIGC玩家

令爷收藏

机器学习聚类算法之K-Means

来源： https://www.biaodianfu.com 机器学习聚类算法之K-Means 根据训练样本中是否包含标签信息，机器学习可以分为监督学习和无监督学习。聚类算法是典型的无监督学习，其训练的样本中值包含样本的特征，不包含样本的标签信息。在聚类算法中。利用样本的特征，将具有相似属性的样本划分到统一类别中，它有点像全自动分…

2024年9月7日 52 0

数据探索分析

风险控制：信用评分卡模型

来源： https://www.biaodianfu.com 什么是信用评分卡模型？评分卡模型又叫做信用评分卡模型，最早由美国信用评分巨头FICO公司于20世纪60年代推出，在信用风险评估以及金融风险控制领域中广泛使用。银行利用评分卡模型对客户的信用历史数据的多个特征进行打分，得到不同等级的信用评分，从而判断客户的优质程度，据此决…

2024年9月7日 74 0

AIGC应用

机器学习之类别特征处理

来源： https://www.biaodianfu.com 类别型特征（categorical feature）主要是指职业，血型等在有限类别内取值的特征。它的原始输入通常是字符串形式，大多数算法模型不接受数值型特征的输入，针对数值型的类别特征会被当成数值型特征，从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式，将…

2024年9月7日 66 0

令爷收藏

机器学习之特征选择方法

来源： https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题，其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征，从而达到减少特征个数，提高模型精确度，减少运行时间的目的。另一方面，选取出真正相关的特征简化模型，协助理解数据产生的过程。并且常能听到“ 数据和特…

2024年9月7日 74 0

Blog

表情符号（emoji）来表示 token

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下让模型知道自己擅长什么、不擅长什么是一个很重要的问题。还记得这些天大模型被揪出来的低级错误吗？不知道 9.11 和 9.9 哪个大，数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点，大模型都只能接受人们的无情嘲笑。嘲笑之后，大…

2024年7月28日 85 0

Blog

AI黑盒研究的突破性进展：Anthropic详解大模型的「思维」特征

AI黑盒研究的突破性进展：Anthropic详解大模型的「思维」特征一直以来 AI 都是一个黑盒子（black box），其内部运作机制是不可见的。人们输入数据并得到结果，但无法检查输出结果的逻辑或者系统的代码。而就在刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。 Anthropic 已经确定了如何在 Claud…

2024年5月29日 75 0

AIGC应用

普通人也能理解的 Transformer

普通人也能理解的 Transformer 闪念基因引言如今爆火的大模型，GPT-3，BERT 等，通过大量的参数和数据，为我们提供了前所未有的自然语言处理能力，使得机器能够更好地理解和生成人类的语言。而注意力机制无疑是重要的基石之一，作为一种新的神经网络结构，使得模型能够更好地捕捉序列中的长距离依赖关系，从而大大提高…

2024年4月16日 91 0

令爷收藏

从思维链(CoT)，到思维树(ToT)，再到思维图(GoT)：用LLMs解决复杂问题！

从思维链(CoT)，到思维树(ToT)，再到思维图(GoT)：用LLMs解决复杂问题！首发: **AINLPer 微信公众号（每日论文干货分享！！** ）编辑: ShuYini 校稿: ShuYi-ni 时间: 2023-09-04 引言为了提高大型语言模型（LLM）上下文学习能力，今天给大家分享的这篇文章提出了思维图（GoT），其性能超过了思维链（CoT）、思维树（…

2023年9月8日 155 0

令爷收藏

ChatGPT 是怎么做的，为什么它有效

、“ 介绍神经网络的基本概念和结构，讨论训练实践、技巧以及网络规模的大小对模型能力的影响。同时介绍嵌入（Embeddings）概念，将高维数据映射到低维空间。通过本文，您将对神经网络有更深入的理解，有助于后面理解 ChatGPT 是怎么做的，为什么它有效。” 01 — 神经网络那么我们用于图像识别等任务的典型模型实际上是如…

2023年7月30日 145 0

AIGC应用

4.2 chatgpt的三步训练

chatgpt的三步训练 1【无监督学习】Pre-trained 预训练让ChatGPT对「海量互联网文本」做单字接龙，以扩充模型的词汇量、语言知识、世界的信息与知识。使ChatGPT从“哑巴鹦鹉”变成“脑容量超级大的懂王鹦鹉”。 1.1 GPT1 GPT-1 的学习材料约 5GB。这里 1 MB 能存 30-50 万汉字，而 1 GB 是 1024 MB。 GPT-1 的参数是 1.17 …

2023年7月9日 182 1

标签：原理

机器学习聚类算法之K-Means

风险控制：信用评分卡模型

机器学习之类别特征处理

机器学习之特征选择方法

表情符号（emoji）来表示 token

AI黑盒研究的突破性进展：Anthropic详解大模型的「思维」特征

普通人也能理解的 Transformer

从思维链(CoT)，到思维树(ToT)，再到思维图(GoT)：用LLMs解决复杂问题！

ChatGPT 是怎么做的，为什么它有效

4.2 chatgpt的三步训练

联系我们

15602395067