Anjhon, 但行好事,莫问前程

  • Home
  • Newsletter
  • Search
机器学习样本不平衡问题

机器学习样本不平衡问题

样本不平衡问题是在生产过程中普遍存在的问题,在很多场景中样本的比例极度失衡,如果不进行处理,那么模型最终的效果可能不尽如人意。本篇收集整理了常用的样本平衡手段和方法。

机器学习特征工程

机器学习特征工程

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。所以机器学习的大部分时间都是在处理数据的过程中,掌握好特征工程的思路和方法,有更高的概率能获得高质量数据。

机器学习异常值识别和处理方法(附代码)

机器学习异常值识别和处理方法(附代码)

异常值可能是在数据采集、数据记录、数据提取等步骤中产生的,异常值的出现会对模型学习进行干扰,所以需要进行特殊处理。而在实际的生产环境中的异常值更是五花八门。

天猫复购预测-挑战赛——Top 0.5%

天猫复购预测-挑战赛——Top 0.5%

根据原数据构建了67个特征,尝试了多种算法和多次参数调优最终得分0.6925,记录过程分享一下。感觉数据指标还可以再优化,调参也还有进步空间,可以进一步优化提升。

Matplotlib & Seaborn 速查

Matplotlib & Seaborn 速查

数据分析可视化一直是短板,完全是因为不怎么用的缘故。把常用的方法整理一遍,以便用时查询。Seaborn基于 matplotlib 进一步封装。

机器学习模型评估方法

机器学习模型评估方法

在选择算法进行建模的时候,每种类型的算法中都有如此多可以用,我们如何选择一个最契合当前数据的模型?模型训练完之后,我们如何知道这个模型的效果?本文整理了机器学习中一些常用的评估方法

Chrome登录Quora重定向问题

Chrome登录Quora重定向问题

今天在使用Chrome登录Quora时老是登不上,选择账号点登陆后,页面刷新后还是停留在登录页面。而且Quora的登录页面默认总是阿拉伯语。。

追日落

追日落

追了三天也没追上的日落,是我一周的痛~

消失的周末

消失的周末

这是一篇简短的随笔

Pytorch速查

Pytorch速查

PyTorch Geometric is a library for deep learning on irregular input data such as graphs, point clouds, and manifolds. skorch. skorch is a high-level library for ...

  • About
  • Friends
  • Books
  • Music
  • Record
© 2021 - 2025 | Anjhon

This site is licensed under the CC BY-SA 4.0.