產業鏈是多企業聯合發展的一種產物。隨著制造業專業化和細分化的不斷發展,現如今的制造業已經從原來一個企業獨自生產一個產品逐漸演化成為以一個產品為主體,各類配件與主體總裝相互配合的模式,其中產業鏈的穩定性則變得較為重要。
產業鏈分析主要數據要素及其作用
以芯片制造產業鏈為例,產業鏈中包括了芯片的品牌方如Intel、AMD、高通、龍芯、華為等半導體產品的品牌方,這些企業均為產業鏈的鏈長企業,而整個產業鏈中還包括芯片研發企業、流片制造商、光刻機生產企業(生產設備制造商)、芯片制造企業、芯片的營銷企業、芯片的物流服務企業、原材料供應商及芯片的使用企業等等,每一家企業都在芯片的產業鏈中處于一個環節,而每一個環節的產業鏈中存在一個或多個龍頭企業及大量的配套廠商,最終所有的企業為整個鏈長企業服務。
基于大數據的產業鏈分析主要數據包括對于整個產業鏈內所有企業數據、宏觀數據、知識產權數據、科研機構、專家/人才、傳媒等信息的采集、分析與服務,從而通過大數據的手段為鏈長提供運行過程決策和未來的發展決策。
其中企業數據包括企業工商數據、企業經營數據(營收、研發投入)、企業投融資數據、企業知識產權數據、企業風險數據、企業招聘數據以及國外企業經營數據(營收、研發投入)。以德系汽車芯片斷芯事件為例,當時受到新冠病毒影響,某國際芯片供應商公司的產能受到嚴重影響,而直觀反映的就是當年的企業經營數據出現收窄。在此之后企業分析在全球范圍內打破該生產瓶頸,通過在馬來西亞投資構建前端廠的方式提高產能,從而逐漸解決產能不足問題,修正產業鏈中的短板,保證了產業鏈的穩定性發展。
宏觀數據 包括平臺基地實驗室、行業報告、科技項目、政策數據、技術封鎖與涉訴糾紛數據以及統計局數據;知識產權數據包括專利數據和論文數據。以高通絞殺華為為例,高通通過各類行業數據分析的方式,逐漸發現出華為作為產業鏈長企業在其科技方面的優勢,從而聯合政府制定相應的反制性政策措施和禁止臺積電進行代工等措施壓制華為的產能,從而實現了高通芯片在5G通信領域的戰略性發展,從宏觀層面實現對于華為的絞殺。
科研機構數據 主要包括產業鏈內科研機構發布的相關發展報告、研究報告、專著、論文、專利、會議講座及其他學術成果物內容數據。主要為產業鏈進行科研學術能力評估評價方面的數據支撐。以比亞迪汽車芯片為例,比亞迪通過各類在科研機構發布的專利、論文專利等方面的內容,分析汽車芯片產業尤其是新能源汽車芯片產業中的科技短板,并重點進行科技攻關,最終在過去的三年逆襲其他汽車新品廠商,最終成為世界汽車芯片產業的新的領軍企業。
專家/人才數據 一方面通過產業鏈的相關協會或學會組織為引導,構建行業內的專家與人才團隊,形成整體的能力資源庫。一方面通過相應的人力資源機構,構建相應的企業人力與崗位需求庫,為后期與高校和企業進行人才培養提供支撐。以龍芯為例,通過分析中國芯片領域的專家人才現狀,構建龍芯博士后工作站,定位于進一步為國家自主創新“卡脖子”行業培養緊缺人才,培養敢于迎接挑戰、有志于從事應用、基礎研究的核心人才。從而為龍芯源源不斷輸送各類頂尖人才,保障龍芯在科研方面的領先地位。

新聞資訊和網址庫 主要是通過采集網絡上的相關新聞資訊和自媒體信息形成相應的數據庫。該種方式更多程度上為產業鏈提供了營銷服務,如之前的芯片漲價潮,就是通過發掘輿論和制造輿論的方式,制造一種芯片產能不足,芯片資源稀缺等假象,從而為各類鏈長企業對本品牌芯片提價提供輿論支撐。
產業鏈分析的主要構建路徑
基于大數據的產業鏈分析模式構建主要包括資源構建、知識處理、成果庫、產業圖譜、區域監測、技術發現、風險指標預測共七個部分。通過該步驟一方面實現對于產業鏈內各種信息的知識化過程,構建起產業鏈發展的總體路線。
資源構建
資源構建通過數據報表向用戶直觀展示各項數據指標的情況。資源中心主要包含企業數據、投融資數據、專利數據、論文數據、政策數據、報告數據、財報數據等。該部分主要是對不同來源的數據根據不同的主題進行歸類、標記和存儲的過程。最終以數據資源庫形式呈現。
在這過程中最大程度上將處于碎片化的知識進行采集、存儲和分析,主要目的在于構建基礎性的產業資源信息數據倉庫,為后面的知識細化處理提供支撐。
知識處理
知識處理用于對整個產業鏈中產生的內部數據(通常是非結構化數據,例如文本、文檔、圖片等)進行知識抽取與數據處理。該過程主要是通過知識圖譜技術,在資源中心的基礎上將數據資源向知識資源轉換的主要過程。
知識處理是對于完成知識庫歸類的數據進行特定分析,找出相應的關鍵詞,關鍵元素,形成知識抽取,并將所有碎片數據進行知識化的過程。
成果庫
成果庫主要是完成知識處理后的內容,通過構建知識圖的方式將碎片化的結構化數據知識進行串聯與處理,并在此基礎上進行相應展示,即知識圖譜。
成果庫所表達的是對于完成知識處理的數據進行深層語義分析與串聯,形成知識梳理的過程。在這過程里,知識內容將被逐漸的體系化,形成帶有一定條理性的集合,如在產業鏈中,所有與某項發明創造相關的所有技術內容將在成果庫中進行集中展現,而這個發明則會被清洗指向到某個產品的核心設計內容。
產業圖譜
產業圖譜則是聚焦在知識圖譜的內容,將與產業相關的知識圖譜進行展示。通過直觀可視的方式將產業內容的所有信息按照一定的邏輯結構進行展現。
在展示中根據對于產業鏈分析的側重點定制出不同的展示指標和內容,如產業的領軍企業、產業的主導企業、產業企業分布等內容。該展示偏于宏觀,主要用于產業經濟與產業組織等方面的宏觀分析。
區域監測
區域監測主要是圍繞區域經濟學展示與分析區域監測相關指標,包括國家產業競爭力指數、國家科技創新競爭力、技術創新指數。表現出某個產業與某個區域之間的關系,從而說明該區域內的產業聚集效應。
技術發現
技術發現則是從科研技術突破角度展示前沿技術和卡脖子技術的技術發現和技術畫像,從而能夠更加清晰展示出目前產業鏈條中的科技突破能力和國產化替代能力,并輔助判斷出該產業發展趨勢和未來需要發力的方向。
風險指標預測
風險指標預測在數據資源構建的基礎上通過構建風險指標庫的方式對于數據資源內容進行計算和評判,得出當前產業存在風險情況進行分析,并以此為基礎進行展示。該方式最大程度上向產業集群展示出其出現的問題和關聯的其他產業鏈的變動情況。
基于大數據的產業鏈分析模式可通過大數據中多元異構數據處理技術對論文、專利、企業、科研機構等多來源的包括Excel、word、txt等多種數據格式的數據進行識別、清洗,形成結構化數據,并形成元數據庫。
在此基礎上基于知識圖譜技術對于元數據進行關聯、挖掘,按技術集的應用場景或行業領域劃分形成產業發展知識圖譜,并實現可視化分析展示,構建資源中心、知識處理中心、風險監測等面向業務分析的場景管理模型,從而達到對于產業鏈上存在的斷點、堵點、盲點實現多維識別的目的,為產業鏈在發展布局、運行監測、問題診斷等方面實現全方面支撐。(作者:劉娜 耿玲玲 趙京鶴)