【】人工智能預測2022世界杯
人工智能預測2022世界杯,人工決賽成為梅西和C羅一生的智能终极終極PK,結果是预测……(2022世界杯比分結果)_世界杯 ( 世界杯,數據 )
www.ty42.com 日期:2022-12-12 00:00:00| 評論(已有356057條評論) 波盈體育小編整理了以下關於 [ 人工智能預測2022世界杯,決賽成為梅西和C羅一生的世界赛成生的世界終極PK,結果是杯决杯比……(2022世界杯比分結果)_世界杯 ] 一些相關資訊 ,歡迎閱讀!为梅2022世界杯小組賽已經全部結束了,西和十六強對陣也全部出爐 ,结果接下來的分结比賽會更令人期待。今天我做了一個預測,人工基於機器學習的智能终极預測結果顯示 :決賽將上演梅西與C羅對決,這真是预测一個令人驚訝又令人興奮的結果 ,因此決定用此文分享出來!世界赛成生的世界
2020年世界杯足球賽冠軍是杯决杯比誰
十六強對陣
2022足球世界杯球隊
今年的世界杯 ,除了比賽本身外(老實說,为梅我看的比賽很少),我最關注的其實是與世界杯相關的數字技術和數據,比如之前曾經《聊聊世界杯的半自動越位技術》,也深深感受到《數字技術改進了世界杯的觀看體檢
2022年世界杯有哪些球隊的隊服是白色的
》。
在接下來的淘汰賽階段,相信大家注意力會更偏重在比賽本身 ,我想到利用人工智能(機器學習)來預測淘汰賽的賽果,在關注世界杯的同時也順便練練技術。
有了這個想法,還想知道有沒有現成的經驗可借鑒。找了一下發現Kaggle上還真有於是我就借鑒了其中一個作者的想法和數據(https://www.kaggle.com/code/sslp23/predicting-fifa-2022-world-cup-with-ml/data?scriptVersionId=111479915)來完成預測,在此對該文作者表示感謝。下麵進入正題 ,對實現過程和技術不感興趣的朋友可直接下拉到“四、預測結果”查看結果。
一 、數據準備
咱們需要幾個數據 ,分別是:
各個國家隊在FIFA的排名數據,以下這樣的數據有6萬多行。
各個國家隊相互之間的曆史戰績數據,以下這樣的數據有4萬多行。
FIFA2022世界杯的比賽對陣情況,對陣的數據獲取比較容易 ,老外可以在維基百科上爬 ,由於眾所周知的原因,我們需要自己生成數據 。
咱順帶看看中國國家隊在過去的三十年間在FIFA的排名情況吧,國家隊在還處在“上升期” ,原諒我又紮了一下老鐵們的心 !
二、數據理解和特征工程
所擁有的原始數據是很難直接用於預測的,因此需要做不少的工作來生成可用於預測的特征,在此過程中也需要結合對足球的理解(從術語的角度來說就是業務與技術的結合),細節不多說了,從需要的工具和主要的工作兩方麵來簡要描述一下要點 :
1、這一階段最主要的技術包括-Python-Pandas-Excel2、 一些主要的工作包括:
-需要將幾張表
融合
-將對陣進球數轉換成勝負平
-將對陣進球數轉換成得分(310)
-檢查一些維度之間的相關性-曆史對陣中主場因素處理
-標記比賽重要度(友誼賽)
-有一些空值需要處理(舍棄)
-數據歸一化
-其它操作
實踐一再證明 ,數據處理是所有工作當中最耗時的,也確實需要技巧!經過一波操作,最終得到如下示例的表。
target一列是比賽結果,0代表贏球 ,其餘的數字列是經過精心準備後決定用於建模預測的維度。
三、建模
建模過程相對容易些,選擇幾個模型,使用網格搜索超參數。因為本次的任務是一個分類任務(而且是二元的,淘汰賽隻有晉級和被淘汰兩個選項),因此可以采用的算法也是挺多的 。
本次使用sklearnt,經過了一些篩選,最後確定使用梯度提升決策樹(GradientBoostingClassifier)
在訓練中,它實現了86%的準確率,在測試集中實現了76%,略優於隨機森林等算法 。
四、預測結果
每一次預測結果由幾部分組成:
對陣雙方
預測會晉級的球隊名稱
贏得比賽的概率值,這個值介於0.5~1.0之間 ,該值越大代表預測的置信度越高 。
1 、預測十六進八的結果
顯然,除了南美的巴西和阿根廷贏球的概率很大以外,其它球隊比賽過程中如果受到一個很強的臨場因素(比如紅牌 ,雖然本屆世界杯小組賽打完才出現2張紅牌,不排除淘汰賽也會出現2張紅牌)或其它未包含在預測模型中的因素影響 ,鹿死誰手其實還蠻難說