扫码关注公众号
网站公告:为了给家人们提供更好的用户体验和服务,股票复盘网V3.0正式上线,新版侧重股市情报和股票资讯,而旧版的复盘工具(连板梯队、热点解读、市场情绪、主线题材、复盘啦、龙虎榜、人气榜等功能)将全部移至VIP复盘网,VIP复盘网是目前市面上最专业的每日涨停复盘工具龙头复盘神器股票复盘工具复盘啦官网复盘盒子股票复盘软件复盘宝,持续上新功能,目前已经上新至V6.2.7版本,请家人们移步至VIP复盘网 / vip.fupanwang.com,另外,每周一、周三晚上20:00~21:00举办VIP复盘网线上实战课,由具有15年私募基金实战经验,精通龙头、短线、中长线等各种模式,熟悉游资操作的竹炜老师给家人们实战复盘,并讲解操盘技巧,每期只开放100个名额,请家人们快速联系客服报名!!!

扫码VIP小程序
返回 当前位置: 首页 热点财经 【合合信息】深耕OCR+AI,拓展商业大数据,技术与产品力构建公司护城河

股市情报:上述文章报告出品方/作者:华创证券,刘欣、廖志国、刘文轩等;仅供参考,投资者应独立决策并承担投资风险。

【合合信息】深耕OCR+AI,拓展商业大数据,技术与产品力构建公司护城河

时间:2025-03-02 23:39
上述文章报告出品方/作者:华创证券,刘欣、廖志国、刘文轩等;仅供参考,投资者应独立决策并承担投资风险。

摘要


公司是一家人工智能及大数据科技企业,产品矩阵覆盖C端及B端。公司以智能文字识别业务起家,目前已成为一家人工智能及大数据科技企业,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。其中智能文字识别业务是公司收入的核心组成部分,从2018年的1.12亿元增长至2023年的9.01亿元,复合年均增长率为52.08%;占收比从57.30%提升至75.91%。公司具有较强的盈利能力,毛利率从2018年的72.54%逐步上升至2023年的84.25%。2024年前三季度实现毛利率84.36%,实现净利率29.21%。


公司所在的智能文字识别领域以及商业大数据领域市场增速可观。根据 Grand View Research 报告,全球智能文字识别服务市场规模2022年达106.5亿美元,预计 2022-2027年复合年均增长率约16.7%。灼识咨询预计中国未来5年智能文字识别领域复合年均增长率达27.3%,2027年市场规模将达人民币168.9亿元。商业大数据方面,灼识咨询预计2020-2025年复合年均增长率将会进一步提高至25.2%,2025年市场规模达到873.7亿元。公司目前主营为智能文字识别和商业大数据业务,均处于行业快速发展的上升周期,叠加公司历经多年技术沉淀与品牌建设,预计公司已迈入快速发展期。


OCR AI,技术和产品力构建公司护城河。近年来,OCR技术与人工智能的结合成为新的发展趋势,公司通过深度学习和自然语言处理(NLP)技术的加成,显著提升了智能文字识别在复杂场景下的性能,能够应对扭曲、手写和多语言识别等挑战。公司坚定融入AI浪潮,TextIn ParseX助力大模型开发者解析版面元素信息,其中大模型训练语料清洗有助于为厂商提供高质量数据集,RPA/Agent功能能够更便捷更高效地处理文档解析优化任务。同时,公司高度重视品牌建设,在搜索引擎中查找“扫描”,扫描全能王位于词条前列,充分体现了公司在产品第一性原理上的深度打磨和卓越成果。


扫描全能王为公司拳头产品,海外市场空间广阔。作为C端SaaS产品,2020-2023年扫描全能王总用户数、月活用户数、付费用户数均逐年增加。APP端月活保持增长趋势,从2020年的8861.94万增长至2023年的12128.46万,复合增长率为10.97%;新增付费用户数从2020年的99.69万增长至2022年114.56万,新增付费转化率从0.58%增长至0.75%。然而海外新兴市场,尤其是发展中国家的新增付费转化率与国内存在较大差距,仍有巨大的用户转化和收入增长空间,海外市场具有极大可想象空间。


投资建议:技术与产品力构建公司护城河,扫描全能王有望率先打开海外付费空间。我们预计 2024-2026 年归母净利润为4.04、5.01、6.28亿元,对应增速 25.0%、24.1%、25.3%;对应 EPS(摊薄)分别为4.04元、5.01元、6.28元。参考可比公司估值,给予合合信息2025年65xPE,目标市值326亿,目标价为326元,首次覆盖,给予“强推”评级。


风险提示:

技术研发与创新能力不及预期、B端业务拓展不及预期、用户付费转化率不及预期。




报告目录


报告亮点与投资逻辑


报告亮点


公司于2024年9月份上市,当前市场仍对公司核心壁垒、市场空间存在分歧。本报告契合市场需求,深入分析公司主营的智能文字识别和商业大数据两块业务情况,提出技术和产品力构建公司护城河的主要观点,分别从OCR、AI、产品的打磨和产品力的打造、先发优势抢占用户心智等角度,多维度展现出公司作为扫描软件龙头具备的竞争优势。同时,公司业务覆盖C端及B端,报告指出C端的扫描全能王业务应为重点研究对象,海外月活及付费率的提升需要持续性关注。


投资逻辑


公司营收业绩稳步增长,盈利能力较高。司营业收入稳健增长,从2018年的1.96亿元增长至2023年的11.87亿元,复合年均增长率达43.35%;归母净利润由-0.79亿元增至3.23亿元。公司具有较强的盈利能力,毛利率从2018年的72.54%逐步上升至2023年的84.25%。2024年前三季度实现毛利率84.36%,实现净利率29.21%。


OCR AI,技术和产品力构建公司护城河。公司通过深度学习和自然语言处理(NLP)技术的加成,显著提升了智能文字识别在复杂场景下的性能。TextIn ParseX助力大模型开发者解析版面元素信息,其中大模型训练语料清洗有助于为厂商提供高质量数据集,RPA/Agent功能能够更便捷更高效地处理文档解析优化任务。同时,公司高度重视品牌建设,在搜索引擎中查找“扫描”,扫描全能王位于词条前列,充分体现了公司在产品第一性原理上的深度打磨和卓越成果。


扫描全能王为公司拳头产品,海外市场空间广阔。作为C端SaaS产品,2020-2023年扫描全能王总用户数、月活用户数、付费用户数均逐年增加。同时,海外新兴市场,尤其是发展中国家的新增付费转化率与国内仍存在较大差距,用户转化和收入增长空间巨大。


关键假设、估值与盈利预测


智能识别业务:C端APP扫描业务:公司C端APP呈现快速发展态势,考虑到公司的会员权益优化、海外市场拓展等因素,用户付费结构有望进一步优化,月活、付费率有望持续提升,预计2024、2025、2026年公司智能识别C端APP扫描业务收入增速分别为24.55%、24.71%、26.68%;考虑到C端APP扫描业务的盈利能力较为稳定,毛利率仍将维持高位,预测2024、2025、2026年毛利率分别为88.49%、88.58%、88.68%。B端服务业务: B端智能识别服务业务现阶段已具备较高的技术竞争力,未来公司将持续优化OCR与AI技术,预计2024、2025、2026年公司B端服务业务的收入增速分别为5.75%、8.49%、12.97%;考虑到B端业务逐渐从“基础识别”向“智能分析”转型,预计毛利率有望持续增长,2024、2025、2026年分别给予65%、68%、70%的预测值。


商业大数据业务: 公司商业大数据业务现阶段保持稳步增长,未来将强化AI与大数据融合、拓展高附加值服务,推动业务向智能化、场景化、差异化方向发展,预计2024、2025、2026年收入增速分别为8.71%、18.38%、22.21%。预计毛利率仍将维持较高水平,2024、2025、2026年分别给予66.27%、64.66%、63.46%的预测值。


互联网推广业务、技术授权业务和其他业务的收入和毛利率均预测保持较为稳定水平。


综上,我们预计2024-2026年公司营收分别为14.26、17.53、22.02亿元,同比增长20.16%、22.93%、25.65%;预计2024-2026年归母净利润分别为4.04、5.01、6.28亿元,同比增长25.00%、24.06%、25.28%。参考可比公司估值,给予合合信息2025年65xPE,目标市值326亿,目标价为326元,首次覆盖,给予“强推”评级。


01

合合信息:深耕智能识别及商业大数据业务


公司是一家人工智能及大数据科技企业,产品矩阵覆盖C端及B端。公司以智能文字识别业务起家,目前已成为一家人工智能及大数据科技企业,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务。其中C端产品主要为面向全球个人用户的 C 端APP产品,包括扫描全能王(智能扫描及文字识别APP)、名片全能王(智能名片及人脉管理APP)、启信宝(企业商业信息查询APP)3 款核心产品;公司B端业务为面向企业客户提供以智能文字识别、商业大数据为核心的服务,形成了包括基础技术服务、标准化服务和场景化解决方案的业务矩阵,满足客户降本增效、风险管理、智能营销等多元需求,助力客户实现数字化与智能化的转型升级。



(一)历经多年技术沉淀及品牌建设,已迈入快速发展期


公司深耕智能识别技术多年,历经品牌建设、业务拓展、快速发展阶段。公司于2006年成立,2009年发布C端产品名片全能王,2010年推出核心产品扫描全能王,2015年在收购苏州贝尔塔后推出了启信宝APP,2017年公司利用启信宝企业版SaaS软件快速切入商业大数据B端服务领域。在此十年期间公司完成了产品矩阵的建设,2024年公司成功登陆科创板。


(1) 2006年-2013年:品牌建设阶段


公司以文字识别和图像处理技术起家,陆续推出名片全能王、扫描全能王APP。公司于2006年在上海成立,将文字识别、图像处理作为核心研发方向。2009年,公司发布名片全能王,实现复杂场景下的纸质名片转变为结构化的数字名片,成为世界上将模式识别技术应用到手机上的APP之一。2010年,公司推出扫描全能王,能够将复杂场景下的文档转变为扫描仪效果的PDF文件或图片。2012年,公司被谷歌评为“全球顶尖开发者”,产品扫描全能王被美国时代周刊列入iPhone必备的手机应用。公司在2013年至2021年连续9年获评“上海专精特新企业”。


(2) 2014年-2019年:业务扩展阶段


公司巩固智能识别业务,同时将主营业务拓展至商业大数据领域。


● 智能识别业务方面2016年,公司将深度学习算法、自然语言处理技术与 OCR 技术相结合,自主研发智能文字识别技术,大幅度提升了智能文字识别技术的性能和应用场景,并将 AI 技术落地成为产品级应用。公司正式成立企业级智能解决方案事业部,布局行业头部客户,输出超过100种证照的OCR基础模块服务。2017年开始,公司针对不同行业复杂场景的文字识别进行更多元化的商业化探索,加速布局智能文字识别AI机器人、AI训练平台等场景化解决方案。


● 商业大数据业务方面:2015 年公司收购了企业公开数据治理服务商苏州贝尔塔。收购后,公司利用自身强大的开发能力快速推出了启信宝APP,作为向大众用户提供企业信息查询及商业调查服务的平台。2016年,公司建立内部的大数据平台部门,有效的推动了公司大数据平台的快速发展。2017年,公司利用启信宝企业版SaaS软件快速切入商业大数据B端服务领域;2018年,公司自主研发的企业知识图谱解决方案开始进行商业落地。


(3) 2020年-至今:快速发展阶段


公司产品矩阵完善,C B业务快速发展。2020年公司更名为合合信息科技股份有限公司。2021年5月,设立美国子公司CamSoft,为公司产品在海外运营提供服务支持。截止2023年底,公司3款C端APP在App Store与Google Play应用市场的全球用户累计首次下载量突破9.4亿;同年2月荣获上海区块链技术协会理事单位。当前公司B端业务已服务近乎30个行业客户,世界500强公司中覆盖超过130家。2023年,公司申请公开发行股票并拟在科创板上市。2024年,公司首次公开发行股票,成功登陆科创板。



(二)股权结构稳定,管理层研发背景雄厚


公司股权结构稳定明晰,创始人镇立新先生为公司实控人。公司自然人持股比例较高,根据2024年9月25日的上市公告书,创始人即董事长镇立新先生为公司实际控制人,直接持股比例为24.19%;罗希平为公司监事会主席,直接持股比例为5.13%;公司高管陈青山、龙腾分别直接持股公司4.7%和2.64%。除此之外,当前前十大股东中还有东方富海(芜湖)股权投资基金(有限合伙)、常州鼎仕投资合伙企业(有限合伙)等机构。上海目一然、上海端临、上海融梨然、上海顶螺均为公司员工持股平台。



截至2024年9月5日,合合信息拥有7家全资中国境内子公司,4家全资境外子公司,1家控股子公司,1 家分公司,3 家下属公司分公司,同时合合信息参股 6 家公司。其中合合信息的重要子公司苏州贝尔塔、上海生腾、上海临冠,为合合信息100%持股并控制,重要子公司Camsoft为上海又冠 100%持股,合合信息最终控制。


公司核心骨干深耕行业多年,经验丰富。董事长镇立新于2009年加入合合信息,凭借十余年的发展历程,将公司打造成了大数据与人工智能领域的重要企业。公司另外两位实控人陈青山和龙腾也都是公司元老级人物。公司管理层大多拥有在国内外知名企业的工作经历,在各自的专业领域积累了丰富的行业经验,为公司的稳步成长奠定了坚实的基础。


创始人镇立新先生是世界顶尖的人工智能领域模式识别技术科学家,是智能文字识别领域的创新引领者之一。镇立新先生在2000年7月至2009年9月任摩托罗拉(中国)电子有限公司高级经理,负责手写识别系统和语音识别技术的研发。合合信息成立后,镇立新带领公司不断探索行业尖端技术与创新方向,领导公司研发团队完成名片全能王、扫描全能王系列产品的研究开发,奠定了公司智能文字识别核心技术的基石,并组建了启信宝研发团队,开拓了公司在大数据领域的新技术研发方向与业务发展方向。截至2023年底,镇立新先生共发表10篇在智能文字识别领域的论文,其作为发明人授权的发明专利58项,其中国际发明专利24项,其作为第一发明人的授权发明专利33项。



(三)专注于智能识别和大数据业务,完善C端和B端产品矩阵


公司专注于智能文字识别及商业大数据业务,布局C B端产品。公司是一家人工智能及大数据科技企业,将AI技术、数据等关键要素进行创新性配置,基于自主研发的领先的智能文字识别及商业大数据核心技术,为全球C端用户和多元行业B端客户提供数字化、智能化的产品及服务,是行业内少有的在C端产品与B端服务拥有完善布局矩阵的企业。公司业务包括智能文字识别业务、商业大数据业务、互联网广告推广业务、手机厂商技术授权业务以及其他业务。其中智能文字识别业务、商业大数据业务为公司主营业务。


● 智能文字识别业务:智能文字识别是AI领域的一个重要分支,融合了智能图像处理、复杂场景文字识别、NLP等AI技术,具备更多认知与理解能力,可适应多语言、多版式、多样式等复杂场景,并可应用到多个商业化场景中。该业务包括C端产品与B端服务,其中C端产品包括扫描全能王、名片全能王两款APP,B端服务包括B端基础技术服务、B端标准化服务和B端场景化解决方案。


● 商业大数据业务:商业大数据是大数据产业的重要领域,利用大数据挖掘、知识图谱、NLP等技术,通过“数据à信息à知识à智能”4个层次,挖掘商业数据背后蕴藏的价值,赋能各行各业。该业务包括C端产品与B端服务,其中C端产品包括APP启信宝,B端服务包括B端基础数据服务、B端标准化服务和B端场景化解决方案。


● 互联网广告推广业务:主要以 APP 端为载体,在启动封面、展示页等广告位向客户展示品牌广告和效果广告,提供广告营销服务,并按照展示时长、展示量或点击量等计费方式与广告客户结算。


● 手机厂商技术授权业务:该业务将名片识别、银行卡识别等技术模块授权给手机厂商、集成在其手机产品中。业务客户集中度较高,收入主要集中在华为、荣耀、三星这些B端客户。



公司具有行业领先的智能识别技术优势及研发实力。公司自2006年成立起,就将文字识别、图像处理作为核心研发方向,在这些领域已拥有近二十年的研发经验以及技术积累。公司曾在多项国际级比赛中夺冠,也曾引领起草、参与了多项相关领域文件、标准等如公司曾在2019年国际文档分析识别大会(ICDAR)上取得表格识别竞赛冠军,在2023年ICDAR中的文本图像篡改检测算法竞赛中取得文本篡改检测任务冠军。2021年,公司作为标准规范知识图谱联盟的理事单位参与撰写了《标准数字化知识图谱白皮书》,2023年5月参与了《文档图像纂改检测标准》的制定工作,同年11月作为主要起草单位参与了SDK 国家标准《信息安全技术移动互联网应用程序(App)软件开发工具包(SDK)安全要求》的编制。


(四)营收规模稳健增长,持续投入研发及品牌建设


公司营收稳健增长,当前增速有所放缓。公司营业收入稳健增长,从2018年的1.96亿元增长至2023年的11.87亿元,复合年均增长率达43.35%。随着公司所处市场逐步趋于稳定,当前公司收入增速有所放缓,从2019年的73.65%下降至2023年的20.04%。2024年前三季度公司实现营业收入10.5亿元,同比增长21.02%。


智能文字识别业务占收比最高,近年仍呈现稳步增长态势。公司智能文字识别业务是公司业务收入的最大组成部分,收入从2018年的1.12亿元增长至2023年的9.01亿元,复合年均增长率约为 52.08%;占收比从57.30%增长到75.91%,收入占比持续提升。2024年第三季度,智能文字识别的C端实现收入2.58亿元,占营收比重为71.58%;智能文字识别B端实现收入0.17亿元,同比增长10.34%,保持稳步增长态势。商业大数据业务在公司整体收入中占据重要地位,但占比逐年下降,从2018年的19.77%降至2023年的15.63%。尽管占比有所下滑,但业务收入仍保持增长,从2018年的3,875万元增长至2023年的1.85亿元,显示出较强的市场竞争力。互联网广告推广业务表现稳健,占比稳定在8%以上。手机厂商授权业务受市场变化影响较大,收入呈下降趋势,占公司营收比重较低,由2018年的14.33%下降至2023年的0.31%。



公司归母净利润于2020年扭亏为盈,近年维持增长态势。2018年至2023年,公司归母净利润由-0.79亿元增至3.23亿元。自2018年起,公司在C端产品的市场推广上加大投入,以提升市场占有率。2018年和2019年,公司研发投入较高,叠加2019年1.66亿元的股份支付费用,两年均处于亏损状态。2022年,得益于收入增长的规模效应和合理的费用控制,公司归母净利润同比增长96.37%至2.84亿元,净利润率达28.70%。2023年归母净利润增速有所放缓,同比增长13.91%至3.23亿元。2024年前三季度,公司实现归母净利润3.07亿元,同比增长11.05%,展现出较强的经营韧性。


公司盈利水平较高,毛利率净利率处于稳定高位。公司具有较强的盈利能力,毛利率和净利率整体稳步提升。公司毛利率从2018年的72.54%逐步上升至2023年的84.25%。2024年前三季度实现毛利率84.36%。从2020年公司扭亏为盈后,净利率也呈现稳健提升态势,从2020年的22.40%提升至2023年的27.24%。2024年前三季度实现净利率29.21%。



公司注重研发及品牌建设,整体费用率已处于稳定区间。公司销售和研发费用率相对处于较高区间,体现出公司对于品牌建设和研发的高度重视。销售费用率在2018年至2023年间总体呈下降趋势,2020年因收入增长带来的规模效应显著下降至27.44%,2021年由于广告宣传和员工薪酬福利投入增加,销售费用率回升至33.27%,2022年起通过调整推广策略后有所降低。管理费用率整体较为平稳, 2019年因股份支付费用较高出现一次性提升至30.94%。财务费用率方面,2022年受汇兑收益影响降至-2.92%,2023年因美元兑人民币升值幅度低于上一年而小幅上升至-0.63%。研发费用率自2020年后随着规模效应逐渐显现而下降,从2019年的61.0%降至2023年的27.25%。



海外营收持续增长,占比稳步提升。2018年至2023年,公司境外及港澳台地区收入由0.7亿元增长至3.97亿元,显示出较强的海外业务扩展能力。分地区来看,北美与亚洲地区贡献较高。2018-2023年,北美地区收入由9061万元增长至2.13亿元,占比从15.67%提升至17.92%,稳居公司境外及港澳台地区收入首位;亚洲地区收入从4637万元增长至7457万元,2023年占比为6.28%,略有波动。此外,欧洲、南美和中国港澳台地区收入也保持稳定增长,共同推动了公司境外业务的整体发展。疫情初期,受居家办公需求增加的影响,公司产品和服务使用频率显著提升,2023年境外收入增长至3.97亿元,占比达到33.43%。



02

智能文字识别:具备行业KnowHow,扫描全能王为拳头产品


智能文字识别服务市场广阔,中国市场增速远超全球。根据 Grand View Research 报告,全球智能文字识别服务市场规模2022年达106.5亿美元,预计 2022-2027年复合年均增长率约16.7%。灼识咨询预计中国未来5年智能文字识别领域复合年均增长率达27.3%,2027年市场规模将达人民币168.9亿元。从下游行业应用来看,金融、物流运输的市场规模是占比最高的两个细分行业。



公司智能文字识别业务分为C端APP与B端服务矩阵。C端APP包括扫描全能王(CamScanner)和名片全能王(CamCard),B端服务主要是证照、银行卡等智能文字识别基础技术服务,系基于名片全能王企业版SaaS软件提供的标准化服务,包括智能文字识别AI机器人与AI训练平台两类的智能文字识别场景化解决方案。


● C端APP业务收入规模较大,盈利能力维持高位。扫描全能王在过去几年中表现出强劲的营收增长势能,由2020年的3.33亿元提升至2023年的8.09亿元,复合增长率达34%。产品盈利水平较高,其毛利率在四年间保持在88%左右的高水平,2023年的毛利润达7.15亿元。相比之下,名片全能王的收入规模较小,维持逐年稳步增长态势,由2020的1667.8万元增至2023年的2448.83万元,复合增长率达13.6%。名片全能王盈利能力的持续优化,毛利率显著提高,从2020年的71.67%上升到2023年的86.72%。B端业务收入保持稳健,毛利率维持较高水平。B端收入从2020年的5412.4万元增长至2023年的6724.72万元,整体较为稳健。B端毛利率虽然有所波动,但整体维持在较高水平,2020-2023年分别为80.63%、73.43%、76.45%、61.68%。2023 年公司智能文字识别 B 端服务毛利率有所下降,主要系部分智能文字识别 B 端场景化解决方案项目交付时间较长,为满足客户需求,公司加大人力投入,在业务开拓的同时抓紧对历史签单项目的落地,2023 年智能文字识别 B 端服务人力成本同比增长 54.03%。



(一)C端:扫描全能王为拳头产品


C端APP为扫描全能王(CamScanner)、名片全能王(CamCard)两款,均为“软件免费 增值服务收费”模式。两款APP具体收费模式为月度、半年、年度多档位会员付费与次付产品相结合,主要通过APP或Web端向个人用户销售,客户通过微信、支付宝、银联等第三方支付平台向公司付费,或通过App Store、Google Play等平台支付,再由平台向公司结算。



1、扫描全能王:拳头产品,海外付费空间广阔


扫描全能王(CamScanner)是一款智能扫描及文字识别APP。该应用现已推出移动端、网页端、小程序3种端口;免费版、付费纯净版(无广告)2种版本。该应用目前提供4个模块,共28种功能:


● 文档扫描:拍题、曲面校正、文字转换等8种;


● 格式转换:转长图、PDF转PPT等4种;


● 文档编辑:智能擦除、PDF瘦身、文档合并等9种;


● 特权项目:翻译、创建文件夹、去广告7种等。


扫描全能王客户遍布全球,曾为效率类免费应用下载量榜首。扫描全能王支持识别中日英韩等41种语言的文档、跨设备同步备份、无线打印、全球30多个国家和地区传真等特性,致力于帮助全球用户实现文档资产的便捷管理。自2010年上线以来截止到2023年12月底,扫描全能王曾在App Store 上84个国家和地区(含中国)的效率类免费应用下载量排名第一,上线至今受到苹果APP STORE精品推荐660 次,并于2013年被时代周刊(TIME)评为“iPhone必备的50个应用之一”。



扫描全能王会员分普通会员与高级会员两种,高级会员按期间分六档购买。高级会员价格分别为45元/月,300元/年;优惠价格分别有连续包月30元/月,连续包季78元/季度,连续包半年98元/半年,连续包年258元/年。首次登录有3天免费试用期,过期自动续费30元/月会员。相较于普通会员,高级会员在CS AI使用次数、拍照计数容量、文件数量限制、广告和水印、证件照模式等20项功能点上拓宽权益。



扫描全能王用户群体覆盖全行业,其中学生群体占比最高。根据公司2020年6月投放的4,869份用户问卷调研显示:扫描全能王用户遍布全行业,其中学生占比最高,为24%,教育/培训/教练/科研场景的用户占比11%,房地产/建筑/建材场景用户占比10%,专业服务场景(咨询/财务/审计)的用户占比为8%。尽管学生群体占比最高,但扫描全能王用户中也包括许多各行业场景中付费能力强的商务人士。



扫描全能王用户月活持续走高,新增付费用户数与转化率均较为可观。境内外互联网与智能设备的高速发展,促进了消费者使用智能终端进行数据处理的习惯,用户对数据资产管理需求进一步提升。2020-2023年扫描全能王总用户数、月活用户数、付费用户数均逐年增加。月活数据中,APP端月活保持增长趋势,从2020年的8861.94万增长至2023年的12128.46万,复合增长率为10.97%;而小程序端月活从2020年的905.61万增长至2021年的1178.57万,但此后呈下降趋势,在2023年下降至712.88万。扫描全能王以用户为核心持续迭代关键技术、优化功能,配合支付宝等支付方式,便捷程度提升,用户付费意愿增长显著,新增付费转化率持续升高,新增用户付费意愿更强,质量更高。其中新增付费用户数从2020年的99.69万增长至2022年114.56万,新增付费转化率从0.58%增长至0.75%。2023年2月起公司为促进新用户的付费转化,扫描全能王将iOS渠道的付费运营策略从“7天试用”转变为“30天试用”,后续在2-12月使用后30天在次月按原价续费半年的用户共约24.64万个,但这部分按“新增付费用户”定义并没有计入当月新增付费用户,导致2023年全年的新增付费用户数、付费转化率出现小幅下降。若将前述24.64万个用户纳入新增付费用户数,2023年新增付费转化率则为0.79%,较2022年保持增长。




高资产迁移成本进一步提高用户粘性,疫情期间老用户续费率与ARPPU值双增长。扫描全能王的核心服务在于为用户提供高价值数字资产管理,因证件、合同等文档的迁移成本较高,带来了较强的用户稳定性。2020年至2022年,月VIP平均续费率从73.20%上升至82.65%,但2023年下降至80.78%,主要是随着2023年初国内居家办公状态逐步解除,用户对居家办公和学习的临时需求减少,导致续费率有所回落。与此同时,公司自2019年起大力推广年费VIP策略,通过不同时长套餐的价格差异引导用户转化为年费VIP。2023年,公司进一步优化年VIP运营策略,提升用户留存率和付费意愿,使年会员订单占比逐年上升,并推动年VIP续费率在2023年达到51.62%的新高。得益于年费订单占比的提升,ARPPU值在2020年至2022年间持续增长,但2023年下降至157.07元,主要原因是公司在主推年费VIP的同时,强化了半年VIP产品的市场推广,半年VIP订单占比从2022年的1.13%显著上升至2023年的13.45%。



扫描全能王较同类产品处于行业领先地位,其他同类APP难以对其构成竞争威胁。截止2023年12月底,根据App Store与Google play合计的用户数量情况来看,扫描全能王2023年的平均月活为14,540.5万,远远高于其他文字识别类APP平均月活。从用户体验上看,截止2023年12月底,扫描全能王在App Store上的iOS中国区评分为4.9, iOS美国区评分也为4.9,合计评分个数超600万,远远超过其他文字识别类APP的用户评分个数。综上,扫描全能王同类APP品在全球月活用户量级、用户评分上较扫描全能王有一定差距,说明扫描全能王具有优于同行业的用户体验与技术水平。以中国 App Store的搜索关键词热度为例,2023年12月,“扫描全能王”的搜索热门程度高于 “扫描”、“文件扫描”、“文档扫描”、“拍照取字”、“文字识别”、“文字提取” 等功能词,说明从用户角度扫描全能王一定程度上已成为扫描及文字识别的代名词。扫描全能王已经在用户规模、品牌知名度、用户口碑、技术壁垒方面建立起了先发优势。




2、名片全能王:智能名片及人脉管理APP


名片全能王(CamCard)是一款智能名片及人脉管理APP。该应用现已推出移动端、网页端、小程序3个端口;免费版、付费纯净版(无广告)2种版本,该应用提供共17项名片管理功能和13项企业查询服务(由启信宝支持)。名片全能王于2009年上线,支持识别17种语言、提供2.3亿家企业深度信息查询服务、包含1000亿条企业商业大数据等特性,致力于提升商务人士工作效率。名片全能王曾在App Store上44个国家(含中国)的商务类免费应用下载量排行榜第一,自上线以来经苹果官方APP STORE精品推荐440 次。


● 名片管理功能:查看名片访客、同步第三方CRM、多张数字名片、名片信息精准录入、多格式(EXCEL/CSV)批量导出等17项;


● 企业查询服务:企业数据批量导出、企业搜索、企业动态监控、查看企业疑似控制人、收益所有人、疑似关系等13项。



名片全能王会员分普通与VIP两档,VIP按期间分五档购买。VIP价格分别为78元/月,388元/年;优惠价格分为连续包月63元/月,连续包年338元/年,798元/三年。首次注册新人福利为238元开通年会员。相较于普通会员,高级会员在交换名片次数、名片信息录入张数、访客记录查询次数、广告、名片分组去重等17项功能点上拓宽权益;另外在企业数据批量导入条数、企业详情信息查看权限、企业信息高级筛选等13项功能点上拓宽权益。



名片全能王营收额保持增长,但营收占比较小且逐年下降。2020-2023年,名片全能王营收分别为1,667.80万、1,883.05万、2,080.95万、2,448.83万,营收额保持增长;营收占比分别为2.88%、2.34%、2.11%、2.06%,呈逐年下滑趋势。


名片全能王用户群体主要为付费能力较强的商务人群。根据公司招股书对2023年活跃用户画像统计,其中在活跃用户的职位分布中,经理级职位的用户数(经理(35%)、总经理(26%)、副总经理(9%)、高级经理(1%)、副经理(1%))占七成以上。



名片全能王总用户数波动走高,付费用户数持续增长。名片全能王在商务名片管理APP细分领域处于领先地位。根据APP Annie数据,截至2023年底,该应用曾在App Store上41个国家和地区商务类免费应用下载量排行榜位列第一,“名片全能王”的搜索热门程度高于“名片”或者“名片管理”,体现出名片全能王一定程度上成为名片管理代名词,具有较高的品牌效应。另外,电子名片等数字资产迁移成本高,维持了高用户粘性。虽然2022年用户居家办公比例增加导致交换名片的商务活动减少,新增注册数小幅下降,但2023年随着经济活动恢复以及公司针对产品功能进行优化,新增注册数迎来一次大的增长。整体来看,公司持续优化关键功能并调整运营策略,2020-2023年该应用实现了用户规模和付费用户数的稳步增长。总用户数从2020年的4,431.96万增长至2023年的6,283.53万,累计增长41.81%;同时,付费用户数从2020年的8.24万增长至2023年的11.06万,增幅达到34.2%。但由于受到微信等社交软件的影响,名片全能王的月活有所波动。



社交方式转变促进小程序端快速增长,成为新用户增长的核心动能。随着微信等社交软件崛起,使用社交软件交换联系方式逐渐取代纸质名片,名片全能王APP月活出现小幅下降,APP月活从2020年254.59万下降至2022年148.74万。2023年,公司抓住新的趋势点,优化了微信小程序端的产品体验,同时加强与钉钉等第三方平台合作,月活止住下降趋势实现反增。自2017年5月,公司进入微信小程序发展红利期,开发小程序功能,利用其易分享传播的特性,打通APP于小程序用户壁垒,实现了微信小程序月活快速增长,微信小程序月活从2020年的92.66万增长至2022年的121.87万,2023年更是增长至178.76万。2019年起,该应用中国境内新增注册用户中,小程序渠道新增注册用户已超过APP渠道新增注册用户数量,成为注册用户增长的重要动力。



付费用户运营策略调整拉动年VIP平均续费率、年VIP订单占比上升,ARPPU值在2022年出现波动。名片全能王在2020年后调整了付费用户运营策略,重点推广年费VIP,推动了年VIP续费率和订单占比的提升。从续费率来看,2020年至2023年间,月VIP平均续费率基本保持在86%-89%之间,整体较为稳定,而年VIP续费率则从2020年的55.57%逐年增长至2023年的65.63%。与此同时,订单结构也发生了明显变化:月费订单占比从2020年的73.54%下降至2023年的46.89%,而1年VIP订单占比从23.58%上升至48.96%。相比扫描全能王,名片全能王的老用户续费率略高,主要由于其目标用户群体主要为商务人士,这类用户具有较强的名片交换需求和更高的付费意愿与能力。在ARPPU值方面,名片全能王于2020-2021年呈现上涨趋势,但在2022年出现波动,主要是国内订购3年VIP的比例相对较高,而2022年上半年部分城市因居家办公减少了商业社交活动,导致高客单价的3年VIP订单占比下滑,进而引发ARPPU值小幅下降。然而,2023年随着公司继续主推年费VIP,单价较高的年份订单占比从2022年的41.27%上升至2023年的52.05%,推动ARPPU值回升至324.01元。



(二)B端:营收整体稳健,持续积累标杆性客户


公司智能文字识别业务的B端服务矩阵按技术深度分为B端基础技术服务、B端标准化服务、B端场景化解决方案。B端业务应用场景广泛,下游多行业客户在证照、合同、票据等各类分档的录入、分类、校对等环节均有数字化转型需求,公司在多行业不仅落地该业务,还打造了标杆型客户,行业横跨银行、政府、物流、制造和地产等。


1)基础技术服务是通用性证照、银行卡、名片、通用文本、表格识别。该服务包含超过 140 种证照识别模块,支持56种语言,通过SDK或API交付给客户。在下游应用领域广泛,包含银行、证券、保险、汽车金融、手机、地产、制造等多元化行业。


2)标准化服务是名片全能王企业版SaaS软件。软件提供面向企业的名片识别、客户名片管理、CRM客户关系管理等基于公有云的服务,客户主要来自日本,因为日本企业重视纸质名片的文化习惯。目前公司正在研发面向中国企业的智能文字识别标准化SaaS产品,主要针对企业数字化转型中对标准化智能文字识别有广泛需求的企业,如中型企业或大型集团分部。


3)场景化解决方案是与行业紧密结合的管理与智能分析服务项目,分为智能文字识别机器人与AI训练平台两类产品。智能文字识别AI机器人包括财报机器人、票据机器人、合同机器人、智能配置机器人等与智能文档分类机器人。现有机器人版本类型丰富,具有稳定性强、业务场景适应性高、能提供API接口、移动端SDK、私有云等多种部署方案。通过自由配置与实际业务流程紧密结合,机器人输出所需的结构化字段结果,灵活应对多种业务场景复杂样本,并进一步提供差异比对、指标分析等智能分析服务。公司也提供对多种AI机器人的管理服务。AI训练平台是TextIn Studio Pro智能文字识别训练平台。该平台无需OCR开发基础即可实现全流程一站式开发平台,支持海量训练数据快速生成、自动化模型生成及完整的模型训练和测试等功能,让文字识别模型训练更简单。



B端服务以客户为核心进行综合评估定价,销售以直销为主,经销为辅。基础技术服务盈利模式为软件一次性永久授权费 升级更新/技术支持服务费 按次收取软件使用费。标准化服务盈利模式为按时间周期收取软件使用费。场景化解决方案盈利模式为软件一次性授权费 升级更新及技术支持服务费。由于根据客户需求特点、产品种类、场景化程度、技术复杂度等因素公司采取综合定价策略,针对不同客户的销售价格不具有绝对可比性。整体基础技术服务、标准化SaaS软件服务的销售单价约为几万元水平,场景化解决方案的销售单价较高,在几十万到数百万之间不等。除一次性永久授权费外,持续迭代的技术升级服务费为B端服务的一大特点,贡献稳定营收。

智能文字识别B端收入存在一定波动,场景化解决方案服务实现稳健增长。由于B端服务应用场景广泛,下游多行业客户在对证照、合同、票据、报表等各类文档的分类、录入、校对、解析等人工环节流程均有数字化转型需求,公司智能文字识别B端2020-2022年营收从5,412万增长至7,120万元。2023年,智能文字识别B端收入下滑至6724.72万元,其中基础技术服务、标准化服务同比均有所下滑。基础技术服务下滑主要系该部分市场竞争日趋激烈,竞争对手进行低价竞争;标准化服务主要销售市场在日本,收入以老客户续期为主,其下滑主要系日本经济整体下滑以及产品推广投入减少。场景化解决方案收入于2023年同比增长17.33%至2519.93万元,主要系公司正积极应对基础技术服务领域竞争,侧重技术附加值更高、市场发展潜力更大的场景化解决方案。



公司研发投入深厚,较其他入局该领域厂商更专注于智能文字识别业务并处于领先地位。公司在智能文字识别领域的主要竞争对手有谷歌、百度、腾讯、阿里等综合性AI厂商,其旗下云平台提供的B端服务包含服务器、云存储、云数据库、人脸识别、语言识别等,智能文字识别仅为其中一种产品。尽管相对前述集团而言,公司资本规模相对偏小、融资渠道相对单一,但智能文字识别业务是公司的核心业务,公司从销售开发、客户服务等其他业务环节全力配合智能文字识别产品的研发与商业化落地,从客户服务质量、行业理解能力与落地能力来看在行业领先。同时在技术方面,公司在智能文字识别技术领域的研发投入已超过 15 年,获得了多项国际比赛奖项。因此,其他厂商切入智能文字识别B端服务领域并未造成公司智能文字识别B端业务显著下降或被替代。



03

商业大数据:C端启信宝处于行列前列,B端服务矩阵输出模式成熟


商业大数据业务分为C端APP产品启信宝和B端服务矩阵(基础数据服务、标准化服务、场景化解决方案)。


商业大数据业务占整体收入约两成,整体毛利率接近70%水平,C端产品保持高毛利,B端矩阵保持高增长。从财务表现来看,商业大数据业务板块在2021/2022/2023年分别实现收入1.41/1.74/1.85亿元,同比增长20%/23%/7%,毛利率分别为68%/69%/68%。拆分产品及服务来看,其中C端产品-启信宝在2021/2022/2023年分别实现收入0.73/0.76/0.70亿元,同比增长8%/4%/-8%,毛利率分别为81%/84%/85%;其中B端服务矩阵在2021/2022/2023年分别实现收入0.68/0.98/1.15亿元,同比增长36%/43%/18%,毛利率分别为54%/57%/57%。



行业层面看,商业大数据指的是围绕企业的各类信息向客户输出服务,预计2025年该市场规模将超人民币870亿元。根据CIC灼识咨询发布的《中国商业大数据服务行业蓝皮书》,商业大数据服务属于大数据服务的一种,其围绕企业的各类信息(包括但不限于:基本信息、股权、司法涉诉、行政处罚、董监高、产业链、舆情等),经过采集、存储、加工、分析等步骤,向客户输出服务。2015年中国商业大数据服务市场规模为77.5亿元,2020年增长至284.1亿元。灼识咨询预计该市场2020-2025年复合年均增长率将会进一步提高至25.2%,2025年市场规模达到873.7亿元。



(一)C端:启信宝位列行业前列,产品功能全,用户粘性高


C端产品为企业商业信息查询APP启信宝。启信宝于2015年上线,受众主要为泛法务、泛商务、政务等行业职场用户。该APP汇集中国境内3亿家企业等组织机构超2,000亿条实时动态商业大数据,提供包括工商、股权、司法涉诉、失信、舆情、资产等超过1,000个数据特征标签;可对数据进行深度挖掘,为客户提供企业关联图谱、舆情监控(情感及语义分析等)、风险监控(经营异常、司法涉诉等)、商标及专利信息、深度报告(信用报告、投资及任职报告、股权结构报告)等多种数据查询、挖掘和智能分析服务。截止2023年底,启信宝在App Store应用市场累计用户首次下载量超过0.1亿,并提供了微信小程序及网页版形态产品。



盈利模式为“软件免费 增值服务收费”模式。截至2024年12月,启信宝提供VIP、SVIP、VIP团队版、联合会员(启信宝、名片全能王、扫描全能王三重权益)多档位VIP会员服务。价格方面,VIP会员1/2/3年价格分别为366/596/780元;SVIP会员1/2/3年价格分别为1,600/3,200/3,200元;VIP团队版价格需要根据购买人数来确定,分1/2/3年套餐,购买人数越多价格越优惠;联合会员1/3年价格分别为888/1,688元。相较于普通用户,VIP会员额外享有49项特权,SVIP会员额外享有56项特权,VIP团队版额外享有55项特权,联合会员在启信宝服务中相当于VIP会员。



C端市场竞争格局相对集中,CR3超85%,2022年启信宝市占率约为7%。由于商业大数据行业的大数据挖掘、知识图谱等技术壁垒较高,且数据采集投入较高,并且商业大数据企业如果涉足商业信息查询C端领域,需要通过一定的营销推广和用户积累树立公正、可信赖、具有知名度的品牌形象,因此商业信息查询C端市场竞争格局相对集中。根据灼识咨询,2022年中国商业信息查询C端市场中市场占有率前三名分别为企查查、天眼查、启信宝三家,三家合计的市场占有率超过85%,其中启信宝的市场占有率约为7%。中国商业信息查询C端APP领域其他参与者收入规模均较小,其余单个最大企业的市场占有率不超过2%。


(二)B端:覆盖行业广,数据分析深,输出模式成熟


按服务内容、下游客户类型及交付形式,B端服务矩阵可分为基础数据服务、标准化服务、场景化解决方案三种形态,技术的附加值、服务的复杂程度依次增高。B端服务在业务规模、客户资源积累、行业多元化程度、服务丰富度等方面具有先发优势,公司具有较强的竞争力,已在不同细分业务领域打造了标杆性案例,处于市场领先地位。


1、基础数据服务是启信宝数据API、数据包服务、数据同步服务。数据API是通过API接口与客户系统对接,提供数据查询和推送服务;数据包是为客户查询并导出特定条件的企业数据进行单次交付的服务。数据同步服务是根据客户需求采取公有云或私有化等方式向客户提供工商、税务、招投标、涉诉等多维度数据信息更新同步服务,通过公司自主研发的FlSync数据同步软件,可实现数据快速同步到客户本地。


2、标准化服务是启信宝企业版SaaS软件服务。该服务为企业客户提供背景调查、关联关系分析、风险监控与舆情预警等数据服务及深度报告下载服务。2021年,该服务获得“可信云”企业级SaaS服务评估认证。


3、场景化解决方案是企业知识图谱解决方案与商业全景数据库服务。


1)企业知识图谱解决方案是利用数据挖掘的具体企业项目。通过海量数据挖掘,帮助客户发现隐形关联关系、风险,进行金融风险管理、供应链企业全生命周期管理、政府园区企业监控等业务。根据应用场景分为以下3类:


a)金融风险知识图谱解决方案:公司技术行业化形成的系统。其能够以模型化、量化的主体行为和风险关联性分析为核心,深度挖掘企业潜在关联关系,如股权、对外投资、控制人、疑似关系等。


b)供应链大数据风控平台:一站式供应链风控平台。平台通过开放的API、插件等系统对接方案,与客户内部的OA、ERP、招采系统等业务系统无缝对接,实现供应商寻源、招标、审核、风险监控等全生命周期管理。


c)产业洞察招商解决方案:基于知识图谱、大数据分析及挖掘技术打造的智能屏幕。公司基于知识图谱、大数据分析及挖掘的核心技术开发的创新产品,该产品包含数据治理、精准招商名单挖掘、招商企业准入、企业风险信息监控、企业信息全景展示等多元增值功能,帮助政府/园区类客户提高决策的科学性和有效性,实现数字化与智能化转型。


(2)商业全景数据库服务是构建全景数据库。该服务将企业内部数据与外部商业大数据融合,集成数据API接口,实现企业尽调、信用审核、风险监控、智能拓客、供应链管理、企业数据大屏等全方位数据支持,具有数据同步技术领先、可实现多线程等复杂情况下数据更新稳定及时、全流程监控、个性化功能、数据加密的特点。



公司在数据技术、业务规模、客户资源积累、行业多元化程度、服务丰富度等方面具备领先优势。相比于C端业务,B端业务不仅需要依靠大数据挖掘、分析和搜索技术,还需要“多源异构的超大规模动态知识图谱构建技术”、“超大规模知识图谱推理与挖掘技术”等相关技术,而公司在长期的业务发展中积累技术优势,此外,公司在业务规模、客户资源积累、行业多元化程度、B端服务丰富度等方面亦具备较好的优势,如公司在金融、制造、科技、政府等行业积累了多个头部标杆性的客户案例(见上图表)。


04

技术和产品力构建公司护城河,海外市场空间广阔


(一)技术:识别准确率行业领先,提供语料清洗、Agent等服务


1、OCR与AI相结合,准确率显著领先行业


OCR技术广泛应用于文档数字化、信息检索和数据分析等领域。光学字符识别(OCR)技术是指通过电子设备(如扫描仪或数码相机)识别纸质文档中的字符并将其转换为计算机可处理的文本格式的过程,被广泛应用于文档数字化、信息检索和数据分析等领域。



传统OCR具备一定局限性,OCR与AI结合成为发展新趋势。OCR技术当前的主要瓶颈在于复杂场景处理、数据安全与隐私保护以及技术迭代的需求。首先,在低质量图像、手写体、复杂背景或多语言环境下,传统OCR的识别准确率往往会下降,因此增强复杂场景下的识别性能已成为关键课题。此外,OCR在处理敏感信息时必须确保数据安全与隐私保护,这一要求构成了另一重大挑战。技术的不断迭代更新也是OCR领域的一大壁垒,要求持续的研发投入以满足不断变化的市场需求和技术进步的要求。近年来,OCR技术与人工智能(AI)的结合成为新的发展趋势。通过深度学习和神经网络模型的应用,OCR系统在复杂场景下的识别精度得到显著提升。目前,基于深度学习的OCR已成为行业主流,未来的发展方向包括一体化的端到端模型、高效轻量化模型,以及向更高智能化的OCR发展,实现从“感知”到“认知”的跃升。



公司深耕OCR领域,融合深度学习和NLP技术,屡获国际奖项。自2006年成立以来,公司专注于文字识别和图像处理,积累了超过15年的研发经验,在智能文字识别技术领域保持行业领先。公司通过深度学习和自然语言处理(NLP)技术的加成,显著提升了智能文字识别在复杂场景下的性能,能够应对扭曲、手写和多语言识别等挑战。公司参与中国信通院牵头制定《文档图像篡改检测标准》,确立了该领域的行业规范。此外,公司在OCR智能化服务和智能文档处理系统的多维评估中,均获得中国泰尔实验室的最高评级,涵盖识别性能、AI核心能力、数据安全性和可靠性。



公司构建强大的数据处理和智能识别能力,满足企业多元需求。多项技术创新构筑公司在大数据领域的核心壁垒,有力满足企业多元化需求。首先,公司持续投入深度学习模型开发,优化OCR技术,提升复杂场景中的识别精度,并支持实时数据提取与清洗,确保数据完整性与质量。同时,公司构建了超大规模自然语言模型训练平台,融合拓扑与语义信息,通过迁移学习高效提取商业文档关键信息,显著提升用户体验与模型性能。公司还积极研发AI自学习平台,实现多业务场景中的自动迭代更新与性能优化。针对移动端和边缘计算,公司开发模型压缩与加速技术,平衡精度、速度与存储效率,确保资源受限环境下的高效应用。



公司产品的OCR识别率显著领先市场同类产品。在复杂场景下(如多语言、多版式、多曲面等),合合信息的平均字符识别率为81.9%,领先于百度的70.0%、腾讯的65.0%和阿里的66.9%。在中文身份证识别测试中,AI开放平台的条目识别率达到99.6%,显著高于百度的98.7%、腾讯的95.9%和阿里的82.1%。此外,公司产品“扫描全能王”在普通文档和多语言数据集、困难数据集、手写数据集和复杂场景数据集的识别率均在90%以上,超越Adobe Scan、WPS、夸克、百度网盘和福昕PDF等其他应用。另外,公司产品在智能文档处理领域方面也有突出表现,并且支持52种主流语言,处于行业领先地位。



2、融入AI浪潮,提供大语言训练语料清洗、Agent等服务


公司坚定融入AI浪潮,TextIn ParseX助力大模型开发者解析版面元素信息。TextIn ParseX为公司专为LLM下游任务设计的通用文档解析服务,能够识别文档或图片中的文字信息,将文档解析为Markdown格式,并按常见的阅读顺序进行还原,赋能下游各类大语言模型任务。



TextIn ParseX具有多元场景,其中大模型训练语料清洗有助于为厂商提供高质量数据集。AI浪潮下,大模型厂商持续需要更多的高质量数据集来优化大模型的训练及推理能力。距离2023年底ChatGPT的爆发已经过去一年多的时间,海内外大模型厂商在模型能力的竞赛已进入白热化,公开的结构化优质数据基本已充分使用,目前许多大厂开始寻求非公开、非结构化数据来扩展参数量,例如书籍、录像等。公司推出的TextIn ParseX具有多元场景,其中大模型训练语料清洗能够高效清洗非结构化文档,准确提取核心内容,自动过滤噪声数据,保留重要语料,有助于为大模型厂商提供增量高质量数据集。



公司积极开发RPA/Agent功能,增强复杂文档自动化处理能力。TextIn ParseX提供RPA(Robotic Process Automation,机器人流程自动化)/Agent(智能体)的功能,能够更便捷更高效地处理文档解析优化任务。通过提供关键信息和标准输出,助力RPA自动化,减少数据处理时间。RPA/Agent功能契合AI应用发展的产业趋势,体现出公司积极融入AIGC浪潮的开放态度。



(二)产品力:积极进行品牌建设,成为“扫描”代名词 


积极进行品牌建设,销售费用保持较高水平。公司销售费用从2020年的1.59亿元增至2023年的3.35亿元,复合增长率为28.4%,主要用于广告宣传、工资福利及差旅招待,三项合计占比超95%。公司2021-2023年的销售费用率分别为33.27%、27.19%、28.24%。其中,广告宣传费由2020年的0.92亿增加至2023年的1.98亿元,复合增长率达29.1%,占销售费用总额的59.02%,这一部分费用主要用于推广C端APP“扫描全能王”。



拳头产品扫描全能王具备高效性能和卓越体验,成为“扫描”代名词。扫描全能王利用先进的OCR技术,将手机和平板变为便携扫描仪,可在复杂场景中将纸质文档转换为PDF或图片,并实现精准的文字识别功能,支持文档归档、查找和共享。用户通过持续积累在应用中的文档资产,实现了高用户粘性和较高的迁移成本,进一步巩固了市场中的领先地位。扫描全能王还依靠文档分享功能促进用户的自然传播,从而实现品牌的低成本推广效应。自2010年上线以来,扫描全能王持续优化功能与识别精度,带动月活跃用户和付费转化率的增长。截至2023年12月底,扫描全能王与其他核心应用在全球的累计首次下载量已超过9.4亿,月活跃用户达1.5亿,进一步确立了其在全球市场的领导地位。在搜索引擎中查找“扫描”,扫描全能王位于词条前列。这款应用已经在用户心中树立了智能高效扫描软件的标杆地位,充分体现了公司在产品第一性原理上的深度打磨和卓越成果。



公司持续推出契合市场的垂直产品,满足多样化需求。2022年,公司推出“蜜蜂”系列,聚焦于教育领域数字化、智能化教学需求,顺应教育信息化趋势,为教师、学生和家长提供高效作业管理、个性化学习指导及便捷的家校互动工具。“蜜蜂作业”运用智能识别和知识图谱技术,提供个性化学习、作业管理等功能,支持教师高效布置批改、学生获得指导、家长实时跟进。自推出以来,“蜜蜂作业”已在全国广泛应用,下载量超数百万,覆盖大量中小学教师、学生和家长用户。“蜜蜂试卷”则提供字迹擦除功能,帮助学生整理错题,提升复习效率,并已集成至华为PixLab V1打印机,拓展智慧教育应用场景。



(三)先发优势 :具备庞大用户基础,抢占用户心智


凭借“起步早”的先发优势建立品牌粘性和客户资源壁垒。公司在移动互联网快速发展的初期,率先推出了核心产品名片全能王、扫描全能王和启信宝,成功积累了庞大用户基础,形成了显著的品牌效应,并进一步建立了用户粘性和客户资源壁垒。名片全能王和扫描全能王凭借超过十年的品牌积淀,在行业内具有深远影响。其中,名片全能王于2010年被《纽约时报》评价为“为低效的名片管理带来有效的秩序”,扫描全能王则于2013年被《时代周刊》评为“iPhone必备的50个应用之一”。这些早期的国际认可为公司奠定了强大的品牌基础。在技术积累方面,公司在智能文字识别领域拥有超过15年的研发经验,其识别准确率始终保持行业领先水平。同时,启信宝依托大数据技术,在数据积累、算法优化和实际应用场景落地方面形成了深厚基础,其商业大数据量已突破1000亿条,为行业客户提供了强有力的数据支持和决策依据。



全球内具有庞大用户基础,市场空间广阔。通过持续的技术创新和产品优化,公司在全球市场中稳固其领先地位,拥有庞大的用户基础,并获得广泛的市场认可。在C端市场,扫描全能王在App Store的效率类应用下载排行榜中位列105个国家和地区的首位,名片全能王在43个国家和地区的商务类免费应用下载量中排名第一;在B端市场,启信宝的业务覆盖超过2.3亿家企业数据,积累了丰富的客户资源,处于行业领先地位。


(四)海外市场空间广阔,未来或为公司发力重心


公司核心产品稳居海内外市场龙头,展现强劲市场竞争力。公司海外收入主要由扫描全能王APP和名片全能王APP等核心产品贡献。2020-2023年,公司境外及中国港澳台收入稳定增长,分别为1.83、3.06、3.54、3.97亿元,占公司总收入31.67%、38.03%、35.78%、33.43%。公司拳头产品扫描全能王在海外发展态势良好,截止2023年12月底,扫描全能王在App Store上的iOS中国区评分为4.9, iOS美国区评分也为4.9,合计评分个数超600万,远远超过其他文字识别类APP的用户评分个数。而目前海外营收占比仍然较小,未来可增长潜力较大。


未来海外用户付费市场仍具有可观拓展空间,新兴市场尤为值得关注。从现有收入分布来看,境外地区收入主要集中在亚洲(日本、韩国等)与北美洲(主要为美国等)。然而,从地域拓展的角度分析,许多海外发展中国家的移动办公APP渗透率和付费率仍有显著提升空间。例如,以扫描全能王为例,2023年中国年新增付费转化率高达1.49%,年付费用户数量达到513万,而巴西、印度尼西亚、墨西哥的转化率仅分别为0.48%、0.09%、0.25%,年付费用户数量仅为18万、11万、6万,远低于国内水平。这表明,海外新兴市场,尤其是发展中国家,仍有巨大的用户转化和收入增长空间,值得进一步深耕与拓展。



公司积极拓展海内外市场,抢占用户心智。通过实施本地化策略,公司在欧美、东亚等主要市场推广产品,依托直销、经销商分成及互联网广告拓展海外收入,并与当地资源丰富的合作伙伴协作,提升国际竞争力。为增强技术支持与服务能力,公司计划建立全球技术支持中心,为客户提供覆盖售前、售中及售后的全面服务,包括产品升级和技术培训。同时,公司正积极扩展全球营销网络,构建本地化销售与服务体系,并通过新媒体运营提升品牌影响力。



05

盈利预测与估值


(一)盈利预测


当前公司业务主要涵盖智能识别系统业务(包含C端APP扫描业务和B端服务业务)以及商业大数据业务。


智能识别C端APP扫描业务: 公司C端APP呈现快速发展态势,考虑到公司的会员权益优化、海外市场拓展等因素,用户付费结构有望进一步优化,月活、付费率有望持续提升,预计2024、2025、2026年公司智能识别C端APP扫描业务收入增速分别为24.55%、24.71%、26.68%;考虑到C端APP扫描业务的盈利能力较为稳定,毛利率仍将维持高位,预测2024、2025、2026年毛利率分别为88.49%、88.58%、88.68%。


智能识别B端服务业务: B端智能识别服务业务现阶段已具备较高的技术竞争力,未来公司将持续优化OCR与AI技术,预计2024、2025、2026年公司B端服务业务的收入增速分别为5.75%、8.49%、12.97%;考虑到B端业务逐渐从“基础识别”向“智能分析”转型,预计毛利率有望持续增长,2024、2025、2026年分别给予65%、68%、70%的预测值。


商业大数据业务: 公司商业大数据业务现阶段保持稳步增长,未来将强化AI与大数据融合、拓展高附加值服务,推动业务向智能化、场景化、差异化方向发展,预计2024、2025、2026年收入增速分别为8.71%、18.38%、22.21%。预计毛利率仍将维持较高水平,2024、2025、2026年分别给予66.27%、64.66%、63.46%的预测值。


互联网推广业务:公司互联网推广业务收入体量较小,营收增速稳健,毛利率高,预计2024、2025、2026年收入增速分别为15%、25%、30%。预计毛利率仍将维持较高水平,2024、2025、2026年分别给予95%、96%、96%的预测值。


技术授权业务:公司技术授权业务营收相对稳定,预计2024、2025、2026年收入一致为0.05亿元。预计毛利率仍将维持高水平,2024、2025、2026年分别给予96%、97%、98%的预测值。


其他业务:预计2024、2025、2026年收入一致为0.01亿元。预计毛利率仍将维持较高水平,2024、2025、2026年分别给予71.50%、72.66%、70.13%的预测值。


综上,我们预计2024-2026年公司营收分别为14.26、17.53、22.02亿元,同比增长20.16%、22.93%、25.65%;预计2024-2026年归母净利润分别为4.04、5.01、6.28亿元,同比增长25.00%、24.06%、25.28%。



(二)估值


公司作为国内扫描软件龙头企业,以订阅为主的商业模式有望持续为公司贡献稳定业绩增量,公司商业大数据业务也在稳步推进,预计公司营收、利润均有望保持稳定增长态势。综合考虑同行业可比公司所处行业、经营规模、产品类型、服务范围等因素,我们选取金山办公泛微网络作为可比公司。参考可比公司估值,给予合合信息2025年65xPE,目标市值326亿,目标价为326元,首次覆盖,给予“强推”评级。


06

风险提示


(1)技术研发与创新能力不及预期:公司核心竞争力在于智能文字识别及AI技术的创新与迭代,技术进步滞后将直接削弱产品竞争力,影响核心业务增长。


(2)B端业务拓展不及预期:公司B端业务依赖于在多行业的应用落地与标杆客户积累,若市场需求下滑或新客户拓展不及预期,将影响公司业务增长的稳定性。


(3)用户付费转化率不及预期:主要C端产品的付费转化率与续费水平存在波动,若用户体验下降或新用户增速放缓,将对公司核心业务的营收增长带来压力。

股票复盘网
当前版本:V3.0