令爷课程
-
机器学习之类别特征处理
来源: https://www.biaodianfu.com 类别型特征(categorical feature)主要是指职业,血型等在有限类别内取值的特征。它的原始输入通常是字符串形式,大多数算法模型不接受数值型特征的输入,针对数值型的类别特征会被当成数值型特征,从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式,将…
-
机器学习之特征选择方法
来源: https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“ 数据和特…
-
Pandas数据处理简明教程
来源: https://www.biaodianfu.com 在使用Python处理分析数据的时候,用的最多的算是Pandas时,由于Pandas是个非常强大的工具,涉及到的功能非常多,所以平常使用的时候经常需要查询文档。这里记载了自己常用的一些功能及知识点。 Pandas简介 Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月…
-
数据科学中10个应用广泛的统计方法
以下是数据科学中广泛应用的十个统计方法的详细描述: 1️⃣ 中心极限定理 (Central Limit Theorem, CLT) 描述: 中心极限定理告诉我们,无论原始数据的分布是什么样的,只要我们取足够多的样本(通常认为样本量大于30就够了),这些样本的均值分布会趋向于正态分布。这个理论是统计学的基石之一,因为它让…
-
Python数据分析7步(IMDb Summer Movies Data)
数据:summer_movies | summer_movie_genres 流程 graph LR A[1导入库] –> B[2导入数据] B –> C[3数据探索与处理] C –> D[4数据可视化] D –> E[5特征工程] E –> F[6模型训练与评估] F –> G[7预测新数据] 数据集说明 以下是两个数据文件的详细说明: 文件1:summer_movies.csv 数据预览: tconst…
-
Python数据分析7步(Iris数据集)
数据:iris.csv Python数据分析7步 graph LR A[1导入库] –> B[2导入数据] B –> C[3数据探索与处理] C –> D[4数据可视化] D –> E[5特征工程] E –> F[6模型训练与评估] F –> G[7预测新数据] 1 导入库 import pandas as pd # 数据处理和分析库 import numpy # 科学计算库 import matplotlib.pyplot…
-
健身房的正态分布例子
以下是chatgpt 4o的描述 重量堆栈正态分布 这张图片显示了一个重量堆栈(可能是一个健身器材)的图示,其中每个重量位置上都有明显的磨损痕迹。这些磨损痕迹在图中形成了一个钟形曲线,类似于正态分布(即常态分布)。 具体来说,这种磨损痕迹集中在中间的重量区间(大约在40到60之间),而两端的重量位置(10-20和90-11…
-
数据分析工具介绍
数据分析工具介绍 数据分析工具在现代商业和科学研究中扮演着重要角色。不同的工具适用于不同的数据规模和分析需求。本文将介绍几种常见的数据分析工具,并讨论它们的替代品和适用场景。 小规模数据分析工具 1. Excel 特点:适用于处理几千到几万行数据,提供基础的数据整理、分析和可视化功能。 用户:个人用户、小型企…
-
什么是GPTs及创建步骤
北京时间 11 月 7 日凌晨 02:00,OpenAI 举办了首次 DevDay 开发者日活动。Sam Altman 用了 45 分钟的时间发布了多款新产品: 新的 GPT-4 Turbo 模型,功能更强大、价格更低廉且支持 128K 上下文窗口。 新的 Assistants API,允许开发人员轻松构建具有目标且能够调用模型及工具的 AI 助手应用。 平台提供新的多模态功能…
-
【令爷推荐好文】到底什么是AI时代的教育?以及怎么实现AI教育学习赋能
到底什么是AI时代的教育?以及怎么实现AI教育学习赋能 以下文章来源于艾笑说 ,作者艾笑 teacherAi 一直有人咨询,且也需要作为教练指导AI+教育航海,索性写了一篇,把航海手册的这部分开个源吧 教育困境与 AI 时代的变革 不论是学前启蒙教育、小初高、还是大学,我们现在的教育和学习都存在着一些怪相和困境。且不说关…
-
吴恩达教授分享:如何用AI构建复杂的工作流程获得良好结果
吴恩达教授提出的四步法,用于构建复杂的AI工作流程和获得良好结果: 1. 编写初始Prompt:编写一个快速而简单的提示词,测试其初步效果。 2. 迭代改进Prompt:根据初步输出的不足之处,逐步改进和扩展提示词,使其更详细。 3. 加入示例或微调模型:如果改进后的提示词仍无法满足需求,可以考虑加入少量示例,或对AI模型…
-
Tableau免费了
⏩支持离线使用自动保存、支持将工作簿保存在本地而不是在线发布; ⏩企业数据可以安心在本地操作而不必泄漏; ⏩可直接选择发布到Public社区,而不必经过繁杂的数据提取再发布环节; 🆓最重要的是:免费!免费!免费!与付费专业版Tableau Desktop Professional Edition相比基本没什么差别,…
-
【杀死你与你无关】GPT-4o导致多邻国暴跌3.4亿市值
GPT-4o 多邻国暴跌3.4亿市值 OpenAI 在推出 GPT-4o 几分钟后就抹去了一家上市公司约 3.4 亿美元的市值。
-
普通人也能理解的 Transformer
普通人也能理解的 Transformer 闪念基因 引言 如今爆火的大模型,GPT-3,BERT 等,通过大量的参数和数据,为我们提供了前所未有的自然语言处理能力,使得机器能够更好地理解和生成人类的语言。而注意力机制无疑是重要的基石之一,作为一种新的神经网络结构,使得模型能够更好地捕捉序列中的长距离依赖关系,从而大大提高…
-
Facefusion是一款最新的开源AI视频/图片换脸项目
AI视频/图片换脸神器累计星12.5k!最近又更新模型啦!Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuison一样,在网页打开操作页面,更加方便。 开源地址:https://github.com/facefusion