阿西吧 去年退选的模式识别在这学期是逃不掉咯
第一次训练要求做一个关于UCI的数据集的可视化分析
但是我在网站上面选取数据的时候发现数据格式是.data
类型,当时没怎么弄清楚还谷歌了很久
其实只要在后面加个csv就可以用pandas导入了
然后就是数据集的列名是单独给你一个文件的,所以在读取的时候要加列名
不过说实话这个数据集挺眼熟的,之前好像在autogluon里面的tabular类里面的样例就是关于
判断一个人的收入是否超过50k,当时用autogluon跑的话准确率还挺高,就是模型占内存大了点
然后我在写代码的时候,原本是打算自己写的,后面还是发现别人写好的真香,下面附上链接
明天看能不能把代码复现一下,然后就准备国赛了
good luck!