Blog

  • MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

    MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式 综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图片(EXIF元数据和OCR)、音频(EXIF元数据和语音转录)、HTML(特别处理Wikipedia等)以…

    2024年12月14日 2
  • Cursor 、v0 和 Bolt.new:当今 AI 编程工具的全面解析与对比

    Cursor 、v0 和 Bolt.new:当今 AI 编程工具的全面解析与对比 AI 驱动的编码工具正在迅速发展,每次新版本的发布都承诺将改变我们的开发流程。这些工具旨在通过智能代码建议、重复任务的自动化,甚至从自然语言提示生成整个代码片段来提升生产力。10月4日,StackBlitz 推出了 Bolt.new,进一步丰富了AI 编码助手的生态系…

    2024年10月15日 29
  • 提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是一个物种了

    提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是一个物种了 谁能最先用 AI 颠覆搜索,至今还悬而未决。 年初,在体验当下几款热门的 AI 搜索引擎后,我和同事都一致认为,即便百度、Google 等搜索引擎巨头被群狼环视,但还是难以被撼动。 最近发布的 Kimi 探索版带来了很大的惊喜。相比于 AI 搜索更懂…

    2024年10月13日 27
  • 50个最佳机器学习公共数据集

    外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,为大家分享一下~ 外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,为大家分享一下~ 提前说下须知: 一、寻找数据集的意义 根据CMU的说法,寻找一个好用的数据…

    令爷收藏 2024年10月1日 31
  • 2023年5个自动化EDA库推荐

    2023年5个自动化EDA库推荐 来源:deephub EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化…

    2024年9月10日 31
  • 探索性数据分析详解

    探索性数据分析详解 来源: https://www.biaodianfu.com 什么是探索性数据分析? 探索性数据分析(Exploratory Data Analysis,简称EDA) 是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 探索…

    2024年9月8日 33
  • 机器学习聚类算法之K-Means

    来源: https://www.biaodianfu.com 机器学习聚类算法之K-Means 根据训练样本中是否包含标签信息,机器学习可以分为监督学习和无监督学习。聚类算法是典型的无监督学习,其训练的样本中值包含样本的特征,不包含样本的标签信息。在聚类算法中。利用样本的特征,将具有相似属性的样本划分到统一类别中,它有点像全自动分…

    2024年9月7日 30
  • 机器学习之类别特征处理

    来源: https://www.biaodianfu.com 类别型特征(categorical feature)主要是指职业,血型等在有限类别内取值的特征。它的原始输入通常是字符串形式,大多数算法模型不接受数值型特征的输入,针对数值型的类别特征会被当成数值型特征,从而造成训练的模型产生错误。 Label encoding Label Encoding是使用字典的方式,将…

    2024年9月7日 39
  • 机器学习之特征选择方法

    来源: https://www.biaodianfu.com 特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant)的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“ 数据和特…

    2024年9月7日 43
  • Pandas数据处理简明教程

    来源: https://www.biaodianfu.com 在使用Python处理分析数据的时候,用的最多的算是Pandas时,由于Pandas是个非常强大的工具,涉及到的功能非常多,所以平常使用的时候经常需要查询文档。这里记载了自己常用的一些功能及知识点。 Pandas简介 Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月…

    2024年9月7日 39
  • 数据科学中10个应用广泛的统计方法

    以下是数据科学中广泛应用的十个统计方法的详细描述: 1️⃣ 中心极限定理 (Central Limit Theorem, CLT) 描述: 中心极限定理告诉我们,无论原始数据的分布是什么样的,只要我们取足够多的样本(通常认为样本量大于30就够了),这些样本的均值分布会趋向于正态分布。这个理论是统计学的基石之一,因为它让…

    2024年9月7日 32
  • 几行乱码让大模型获得科学思维:超级提示

    https://github.com/NeoVertex1/SuperPrompt#superprompt 不过两三天的时间,仅有两个 Markdown 文件的 GitHub 项目为何竟能收获 1.9k star? 仔细一看,其中一个 Markdown 文件是一个流程图,另一个 Readme 文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这个 prompt,却发现里面仅有寥寥数句人类能懂的…

    Blog 2024年9月5日 38
  • 机器学习入门

    拥抱人工智能,从机器学习开始 背景: 自“阿尔法狗”(AlphaGo)完胜人类围棋顶尖高手后,有关人工智能(AI)的讨论就从未停歇。工业4.0方兴未艾,人工智能引领的工业5.0时代却已悄然苏醒。 人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展,而深度学习的进步却是当今人工智能大爆炸的核心驱动。 作…

    Blog 2024年9月4日 33
  • Cursor + Claude 3.5 Sonnet 案例

    Cursor太火了,很多人都放弃 GitHub Copilot ,转投 Cursor了。 Cursor + Claude 3.5 Sonnet 彻底改变了大家编程的体验,网友们几个惊艳的例子↓ 第一个就很震惊! 8 岁的孩子能在 45 分钟内构建了一个由Cloudflare Workers AI 驱动的聊天机器人 11k 行代码,685 次提交,整整 3 周,一个视频编辑器 Cursor+V0创建一个漂…

    AI应用 2024年9月1日 48
  • 从电力革命到AI:组织创新驱动下的生产力飞跃

    1.谷歌前CEO说现在像电力革命前夕 在2024年8月13日,谷歌前CEO埃里克·施密特在斯坦福大学的演讲中指出,尽管AI技术已经取得了显著的进步,并在许多领域得到了广泛应用,但其真正的潜力尚未完全释放。他强调,当前的AI应用大多集中在替代或辅助人类完成特定任务上,而未能引发深刻的组织变革。这种情况类似于19世纪末期电…

    2024年8月17日 51

联系我们

15602395067

在线咨询:点击这里给我发消息

邮件:eden7@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code