近幾年來(lái),儀器儀表行業(yè)按照市場(chǎng)經(jīng)濟(jì)規(guī)模的要求,加大企業(yè)結(jié)構(gòu)調(diào)整力度,企業(yè)間通過(guò)聯(lián)合、兼并等方式,從而使決策樹(shù)生成算法在儀器儀表行業(yè)有了一定的影響力。
一、決策樹(shù)生成算法在儀器儀表行業(yè)中淵源:
在當(dāng)今的市場(chǎng)經(jīng)濟(jì)社會(huì), 納稅人在偷稅前要權(quán)衡得失, 只有當(dāng)偷稅成本低于偷稅收益時(shí), 偷稅才可能成為現(xiàn)實(shí)。本文通過(guò)應(yīng)用數(shù)據(jù)挖掘決策樹(shù)生成算法, 從龐大的稅收數(shù)據(jù)中挖掘建立偷稅決策樹(shù), 可以幫助稅務(wù)管理人員提高對(duì)納稅人偷稅行為的判斷準(zhǔn)確性, 提高對(duì)偷稅行為的查處概率( 目前我國(guó)的查處概率大約在40%) , 提高納稅人的偷稅成本, 使納稅人意識(shí)到偷稅會(huì)“得不償失”, 來(lái)減少納稅人偷稅行為的發(fā)生?;緵Q策樹(shù)算法是一個(gè)貪心算法, C5.0 是有名的決策樹(shù)算法, 它通過(guò)選擇信息增益( 熵減少的程度) 的屬性作為測(cè)試屬性并產(chǎn)生分支節(jié)點(diǎn), 并根據(jù)這一屬性的取值產(chǎn)生相應(yīng)的( 決策樹(shù)) 分支, 對(duì)產(chǎn)生的( 決策樹(shù)) 分支遞歸處理, 又獲得一個(gè)決策( 子) 樹(shù), 直至滿足停止條件, 產(chǎn)生一棵完整的決策樹(shù)。本文通過(guò)運(yùn)用基于貪心算法的數(shù)據(jù)挖掘工具, 對(duì)稅收征收管理數(shù)據(jù)和企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行處理, 生成納稅人偷稅決策樹(shù),并應(yīng)用于稅務(wù)稽查選案工作中, 收到了良好效果。
二、決策樹(shù)生成算法在儀器儀表行業(yè)中基本概念:
數(shù)據(jù)挖掘, 又稱為數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)( Knowledge Discovery fromDatabase, 簡(jiǎn)稱KDD) , 它是一個(gè)從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過(guò)程。決策樹(shù)是數(shù)據(jù)挖掘分類與預(yù)測(cè)的一種。它是一個(gè)類似流程圖的樹(shù)型結(jié)構(gòu), 其中樹(shù)的每個(gè)節(jié)點(diǎn)代表對(duì)一個(gè)屬性的測(cè)試, 其分支就代表測(cè)試的每個(gè)結(jié)果; 而每個(gè)葉節(jié)點(diǎn)就代表一個(gè)類別。圖1 是根據(jù)來(lái)自加拿大的勞動(dòng)合同談判數(shù)據(jù)集合所挖掘出的決策樹(shù)。
決策樹(shù)生成算法在儀器儀表行業(yè)中,具有一定的意義,儀器儀表產(chǎn)品結(jié)構(gòu)基本合理,各類產(chǎn)品的發(fā)展比較協(xié)調(diào)。
http://www.dgzhenghang.cn