标签:原理

  • 机器学习聚类算法之K-Means

    来源: https://www.biaodianfu.com 机器学习聚类算法之K-Means 根据训练样本中是否包含标签信息,机器学习可以分为监督学习和无监督学习。聚类算法是典型的无监督学习,其训练的样本中值包含样本的特征,不包含样本的标签信息。在聚类算法中。利用样本的特征,将具有相似属性的样本划分到统一类别中,它有点像全自动分…

    2024年9月7日 30
  • 风险控制:信用评分卡模型

    来源: https://www.biaodianfu.com 什么是信用评分卡模型? 评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头FICO公司于20世纪60年代推出,在信用风险评估以及金融风险控制领域中广泛使用。银行利用评分卡模型对客户的信用历史数据的多个特征进行打分,得到不同等级的信用评分,从而判断客户的优质程度,据此决…

    2024年9月7日 40
  • 机器学习之类别特征处理

    来源: https://www.biaodianfu.com 类别型特征(categorical feature)主要是指职业,血型等在有限类别内取值的特征。它的原始输入通常是字符串形式,大多数算法模型不接受数值型特征的输入,针对数值型的类别特征会被当成数值型特征,从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式,将…

    2024年9月7日 39
  • 机器学习之特征选择方法

    来源: https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“ 数据和特…

    2024年9月7日 43
  • 表情符号(emoji)来表示 token

    为什么AI数不清Strawberry里有几个 r?Karpathy:我用表情包给你解释一下 让模型知道自己擅长什么、不擅长什么是一个很重要的问题。 还记得这些天大模型被揪出来的低级错误吗? 不知道 9.11 和 9.9 哪个大,数不清 Strawberry 单词里面有多少个 r…… 每每被发现一个弱点,大模型都只能接受人们的无情嘲笑。 嘲笑之后,大…

    2024年7月28日 45
  • AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征

    AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征 一直以来 AI 都是一个黑盒子(black box),其内部运作机制是不可见的。人们输入数据并得到结果,但无法检查输出结果的逻辑或者系统的代码。 而就在刚刚,Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。 Anthropic 已经确定了如何在 Claud…

    2024年5月29日 51
  • 普通人也能理解的 Transformer

    普通人也能理解的 Transformer 闪念基因 引言 如今爆火的大模型,GPT-3,BERT 等,通过大量的参数和数据,为我们提供了前所未有的自然语言处理能力,使得机器能够更好地理解和生成人类的语言。而注意力机制无疑是重要的基石之一,作为一种新的神经网络结构,使得模型能够更好地捕捉序列中的长距离依赖关系,从而大大提高…

    2024年4月16日 62
  • 从思维链(CoT),到思维树(ToT),再到思维图(GoT):用LLMs解决复杂问题!

    从思维链(CoT),到思维树(ToT),再到思维图(GoT):用LLMs解决复杂问题! 首发: **AINLPer 微信公众号( 每日论文干货分享!!** ) 编辑: ShuYini 校稿: ShuYi-ni 时间: 2023-09-04 引言 为了提高大型语言模型(LLM)上下文学习能力,今天给大家分享的这篇文章提出了思维图(GoT),其性能超过了思维链(CoT)、思维树(…

    2023年9月8日 129
  • ChatGPT 是怎么做的,为什么它有效

    、“ 介绍神经网络的基本概念和结构,讨论训练实践、技巧以及网络规模的大小对模型能力的影响。同时介绍嵌入(Embeddings)概念,将高维数据映射到低维空间。通过本文,您将对神经网络有更深入的理解,有助于后面理解 ChatGPT 是怎么做的,为什么它有效。” 01 — 神经网络 那么我们用于图像识别等任务的典型模型实际上是如…

    2023年7月30日 127
  • 4.2 chatgpt的三步训练

    chatgpt的三步训练 1【无监督学习】Pre-trained 预训练 让ChatGPT对「海量互联网文本」做单字接龙,以扩充模型的词汇量、语言知识、世界的信息与知识。使ChatGPT从“哑巴鹦鹉”变成“脑容量超级大的懂王鹦鹉”。 1.1 GPT1 GPT-1 的学习材料约 5GB。 这里 1 MB 能存 30-50 万汉字,而 1 GB 是 1024 MB。 GPT-1 的参数是 1.17 …

    2023年7月9日 159

联系我们

15602395067

在线咨询:点击这里给我发消息

邮件:eden7@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code