基于机器学习的科技型中小企业创新能力评价指标体系构建研究

时间:2023-06-21 09:45:02 来源:网友投稿

文/章立,唐余康,周萍,赵启程,尹威

科技型中小企业是极具活力和潜力的创新主体,是强化企业创新主体地位的重要力量。江苏省科技型中小企业面广量大,但仍存在量多质不优,主动创新意识和创新能力总体偏弱的情况,研究构建科技型中小企业创新能力评价体系,挖掘出创新能力强、科技含量高的优质企业,有助于提高科技资源配置的精准度和有效性,对科技型中小企业培育具有十分重要作用。国内外学者从不同的视角对企业创新能力评价进行了大量的研究,本文在现有的科技型中小企业评价基础上,以江苏省2018-2022 年科技型中小企业评价入库企业信息为样本,通过人工智能算法研究构建企业创新能力评价指标体系。

科技型中小企业的发展状况关系到整个地区经济和产业发展,是国家创新能力的重要来源[1]。2017 年,为进一步推动大众创业万众创新,加速科技成果产业化,加大对科技型中小企业的精准支持力度,壮大科技型中小企业群体,培育新的经济增长点,科技部、财政部和国家税务总局联合印发《科技型中小企业评价办法》,明确了科技型中小企业的标准。截至2022 年底,全国科技型中小企业评价入库企业数量达到45.4 万家,较2021 年增长38.4%。江苏一直高度重视科技型中小企业创新发展,自科技型中小企业评价开展以来,多措并举挖掘推动全省科技型中小企业“应评尽评”,在政府引导和支持下,2022 年江苏省科技型中小企业评价入库企业数达8.7 万家,成为全国首个突破8 万家的省份,近三年江苏省入库企业数连续位居全国第一。

通过对2018-2022 年江苏省科技型中小企业评价入库企业信息分析和日常走访调研,发现部分科技型中小企业由于创新资源匮乏、开拓市场经验不足等影响,存在研发投入不足、创新产出效率较低,科技成果转化能力较弱等问题。如何进一步精准评价科技型中小企业创新能力,提高资源配置促进企业加速成长,对培育发展新动能、推动高质量发展显得尤为重要。现有的企业创新能力评价指标体系多数采用主观的打分法,结合机器学习的客观评价体系正逐渐被主流领域所接受。

陈强远(2020)利用机器学习算法对企业授权发明专利数据进行分析,结合语义引用测度了企业技术创新质量[2]。杨子晖等(2022)使用因子分析构建系统性风险指标,结合随机森林模型进行预测,取得了更为有效的预测结果[3]。刘云菁等(2022)采用轻量梯度提升机算法对11 类财务指标进行分析,识别上市公司财务舞弊[4]。新兴的机器学习算法是对传统方法的补充与提升,同时也为本文的研究提供指引。

1、科技型中小企业评价填报信息

科技型中小企业评价入库企业填报信息主要包括企业基本信息、研发费用、科技成果、直通车、财务信息以及人员信息,详见表1。

2、新增信息

通过填报信息计算,可得到杠杆比率、资产收益率、毛利率以及科技人员在职率等相对指标信息,详见表2。

3、创新能力指标体系构建

基于2018-2022 年江苏省科技型中小企业评价入库企业样本信息,将企业评价分为五大维度,分别为研发投入强度、科技人员水平、科研能力、科技成果以及盈利能力。考虑企业信息绝对值可比性较差,本文除科技成果外,其他均转化为相对值,且参考曹桃云和陈敏琼(2021)的研究[5],采用随机森林算法,通过指标筛选,最终确定创新能力指标体系,详见表3。

表1 评价入库企业填报信息

表2 新增相对信息及计算方法

表3 五大维度的创新能力指标体系构建

表4 研发投入强度指标聚类情况

表5 科技人员水平指标聚类情况

为验证创新能力评价指标体系的有效性,参考张成岗和王明玉(2022)研究的方法[6],采用聚类分析将样本分为两组,特征相似的企业将被归为同一组,并且两组间的样本有明显的差异,进而区分出表现相对较好的样本组以及相对不足的样本组。具体的聚类过程如下:

①随机选择两个聚类的中心位置C1 和C2(初始化)。

②循环执行两个步骤直至收敛:一是将每个观测值xi 重新分配到离它最近的聚类Ck(分配),二是更新每个聚类的中心位置

④由于聚类结果依赖于初始聚类中心位置,因此会尝试不同的初始聚类中心位置(设置不同的随机数种子),然后选择最佳结果,最小化全样本SSE,最终得到具有区分度的两类样本集合。

通过观察不同年度中两类样本的占比可以初步验证方法的有效性,分项验证结果如下。

1、研发投入强度

研发投入强度分年份样本的频数与频率如表4 所示,可以看出各年份之间的聚类结果相近,体现了结果的稳定性。

表6 科研能力指标聚类情况

研发投入强度聚类样本分布如图1 所示,杠杆比率对样本研发投入强度的区分度较强,较少的样本具有较高的杠杆比率,结合其它指标可以发现,样本在不同年度中均可以分为比例稳定的两个类别。

2、科技人员水平

科技人员水平分年份样本的频数与频率如表5 所示,与研发投入强度相比,其分布稍有不同,但各年份之间的结果稳定性依然很强。

科技人员水平聚类样本分布如图2 所示,可以明显看出指标对于企业的分类效果同样是显著的。职称率对样本科技人员水平的区分度较强,较少的样本具有较高的职称率,结合其它指标可以发现,样本在不同年度中均可以分为比例稳定的两个类别。

3、科研能力

科研能力分年份样本的频数与频率如表6 所示,同样可以看出各年份之间的聚类结果相近,稳定性较强。

科研能力聚类样本分布如图3 所示,首先对高新技术企业、省部级研发机构、科技奖励、制定标准指标采用主成分分析法提取出主要因素,然后再使用聚类分析进行检验,样本在不同年度中均可以分为比例稳定的两个类别。

4、科技成果

科技成果分年份样本的频数与频率如表7 所示,可以看出随着年份的变化,科技成果不同类型的企业比例变化较大。

科技成果聚类样本分布如图4 所示,可以明显看出指标对于企业的分类效果是显著的,其中一类知识产权数量对样本的区分度较强,并且随着年份的不同,分化越大,体现出科技成果的重要性在不断地提升。

5、盈利能力

盈利能力分年份样本的频数与频率如表8 所示,同样可以看出各年份之间的聚类结果相近,体现了结果的稳定性。

盈利能力水平聚类样本分布如图5 所示,毛利率对样本盈利能力水平的区分度较强,较少的样本具有较低的毛利率,结合其它指标可以发现,样本在不同年度中均可以分为比例稳定的两个类别。

表7 科技成果指标聚类情况

表8 盈利能力指标聚类情况

通过运用聚类分析算法从研发投入强度、科技人员水平、科研能力、科技成果以及盈利能力五个维度对企业进行评价,特征相似的企业将被归为同一组,两组间的样本有明显的差异,表明构建的科技型中小企业创新能力评价指标体系可以较好地对企业类型进行区分。政府部门、金融机构等可通过本文构建的创新能力评价指标体系,为企业成长特征进行“画像”,研究分析营造企业创新环境的具体举措和发展途径,进一步精准匹配各类资源,推动形成良好的企业递进发展生态。

猜你喜欢科技型年份科技成果特殊的一年小猕猴智力画刊(2021年11期)2021-11-28云创新助推科技型中小企业构建持续性学习机制经济与管理(2020年4期)2020-12-28打通科技成果转化“最后一公里”商周刊(2019年1期)2019-01-31什么是闰年?儿童故事画报·自然探秘(2016年4期)2016-06-24一样的年份科学启蒙(2016年5期)2016-05-10民营科技型集团公司人力资源管理实践现代冶金(2016年6期)2016-02-28助力科技型中小企业铺天盖地顶天立地天津人大(2015年9期)2015-11-24论科技型中小企业科技人才供给体系的构建西藏科技(2015年11期)2015-09-26更正上海预防医学(2014年2期)2014-06-03科技成果航天器工程(2014年6期)2014-03-11

推荐访问:指标体系 创新能力 中小企业