全部 A 股的 2023 年 12 月数据,一整份都整理好了,字段信息也挺全。像证券代码、注册资本、公司电话这些基本信息不说,还有员工总数、专利数量、行业分类这些深度字段,起来方便。
用的是tsv格式,字段间用 tab 分隔,读起来清爽,像用pandas.read_csv(..., sep='\\t')也顺手。如果你是在搞行业研究或者建数据库建模,这份数据拿来直接开搞都没问题。
而且后面还贴心整理了不少关联资源,像是行业分类的SQL 文件、国标代码、行业应用案例啥的。要扩展行业标签、做特征工程,都有得用。
哦对了,数据中也包含了是否属于专精特新“小巨人”企业这些细分分类,做政策扶持相关项目时也能直接拿来筛。响应也快,结构也清晰,适合挂在脚本里每天跑。
如果你是做量化、企业画像或者大数据建模这块的,可以说是挺实用的一份底层数据资源。你可以从这里顺手了解下 2017 年行业分类 SQL 的样子,也方便对照使用。