改进 AdaBoost 算法在信贷不平衡分类 -读后感
为了控制信贷风险,需要有效的方法来正确识别信贷违约用户,即解决信贷分
类问题。然而,大部分信贷数据集为信贷不平衡数据集,因而控制信贷风险的关键在于解决信贷不平衡分类问题。
研究背景与研究意义
研究背景
对于信贷风险的研究,重点在于通过合理有效的技术手段来判断某用户的某笔消费信贷业务是否会发生信 ...
Boosting算法 AdaBoost 算法
Bagging
Bagging 指的是一种叫做「Bootstrap Aggregating」(自助聚合)的技术。其实质是选取 T 个 bootstrap 样本,在每个样本安装一个分类器,然后并行训练模型。通常,在随机森林中,决策树是并行训练的。然后,将所有分类器的结果平均化,得到一个 baggin ...
基于大数据的互联挖金融欺诈行为识别研究 阅读
绪论
传统金融中,是以房产、固定资产为抵押物的抵押贷款,以及以应收账款、订单抵押的供应链金融 。而互联网金融中,为达到快速征信,快速办理,摆脱传统金融繁杂的手续过程,更多的是以个人信用为抵押的网络信用贷款。因此服务效率由低到高不断的提升,但是同时也对风险控制提出了更高的挑战、P2P网贷的最大特色是 ...
python中join的用法
python笔记
python中join的用法
Python中有join()和os.path.join()两个函数,具体作用如下:
join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串
os.path.join(): 将多个路径组合后返回
py ...
机器学习在网络攻击检测中的应用
机器学习在网络攻击检测中的应用
研究现状
研究现状:针对当前入侵检测系统的不足,许多专家学者提出了将数据挖掘技术与机器学习算法融入到入侵检测系统中的方案
主要有:1.利用聚类技术减少支持向量的入侵检测系统
使用支持向量机一个很严重的问题就是极低的分类速度,分类速度是由支持向量的数量决定的。基于经 ...
垃圾邮件过滤技术
项目背景
垃圾邮件过滤概述
随着互联网的蓬勃发展,电子邮件已经成为互联网上最普遍的通讯方式之一;据最新调查显示,2017Q3季度中国是世界最大垃圾邮件产生国和第二大受恶意邮件袭击的国家。垃圾邮件的内容主要包括欺诈邮件、新闻议程、钓鱼攻击邮件、站点宣传邮件、病毒邮件等等
垃圾邮件的影响
占用网 ...
常用python代码工具
#批量更改文件名
Codeimport osimport sysfrom functools import cmp_to_keydef compare(x, y): stat_x = os.stat(path + "/" + x) stat_y = os.stat(path + "/" ...
计算机系统基础
计算机系统概述
为什么要学习计算机系统基础
为什么要学习“计算机系统基础”呢?
– 为了编程序时少出错
– 为了在程序出错时很快找到出错的地方
– 为了明白程序是怎样在计算机上执行的
– 为了强化“系统思维”
– 为了更好地理解计算机系统,从而编写出更好的程序
– 为后续课程的学习打下良好基础 ...
基于python实现CNN卷积层及卷积运算优化学习
推导过程:
符号说明:
DNN反向传播原理
卷积层反向传播推导
前向传播:
im2col的实现
im2col():输入数据根据滤波器、步幅等展开的二维数组,每一行代表一条卷积输入数据
卷积就是卷积核跟图像矩阵的运算。卷积核是一个小窗口,记录的是权重。卷积核在输入图像上按步长滑动 ...
GoogleNet 和ResNet
GoogleNet 和ResNet
GoogleNet :
在同一层级上运行具备多个尺寸的滤波器,通过1x1,3x3和5x5、和池化层,提取了多尺度的特征,另外,在pooling层添加一个额外的并行pooling路径用于提高效率。
GoogelNet V1-V4
V1:
ResNet:
ResNet ...