中國科學軟件網-首頁 黑龙江11选5前三组 腾讯欢乐捕鱼大战攻略 天谕跑商最赚钱的路线 电脑版单机捕鱼达人 高频彩稳定赚钱 成都皮皮麻将微信群 写情感文章赚钱的公众号 地下城勇士的决战者怎么加点 怎么通过买鞋赚钱吗 天鸽彩金捕鱼安卓版 开长途客车赚钱吗 利升宝彩票首页 年轻人2019搞什么会赚钱 全民玩麻将辅助器 mysql安装教程赚钱 qq幻想 赚钱吗 8号彩票游戏
爬蟲俱樂部2019暑期Stata編程訓練營

爬蟲俱樂部將于2019年8月22日至28日湖北武漢舉行為期一周的Stata編程技術定制培訓,此次采取初級班和高級班分批次培訓。課程通過案例教學模式,旨在幫助大家在短期內掌握Stata軟件編程、金融計量知識和實證分析方法,使大家熟悉Stata核心的爬蟲技術,以及Stata與其他軟件交互的高端技術。

初級班主要是為了讓學員掌握Stata數據分析技巧,并能獨立撰寫相關的程序。涉及內容包括多種數據格式的讀取和輸出、數據的合并、實證結果的輸出以及爬蟲俱樂部編寫的命令介紹等。

高級班主要是為了讓學員掌握Stata軟件進階操作,涉及內容包括正則表達式、網絡爬蟲技巧、文本分析等技術。經過團隊精心策劃,此次課程新增北大法寶裁判文書信息提取和百度地圖api調用兩大案例,以及新興實證研究方法介紹,相信定能讓學員受益匪淺!

自創立以來,爬蟲俱樂部團隊開發了多個便捷高效的Stata命令,如cntrade、cnintraday、cnar等可以讓用戶快速獲取中國股票日交易、日內分時數據、中國上市公司財務數據;chinagcode和chinaaddress實現了中文地址和經緯度的相互轉換,reg2docx、t2docx、sum2docx和corr2docx使結果輸出更加簡潔,subinfile讓網頁內容分析和內容抓取異常簡單……同時,團隊也培養了眾多優秀學生,向香港大學、香港理工大學、香港嶺南大學和澳門大學等知名高校輸送了一批高質量的研究助理,包括薛原、徐鑫、劉貝貝、李子健、趙一、周鵬、司海濤、張計寶等。由于技術精湛和工作勤奮受到用人單位的一致稱贊。

迄今,爬蟲俱樂部已開展近20期線下培訓活動,曾應邀在武漢大學、華中科技大學、中央財經大學、中南財經政法大學、西南財經大學、蘭州財經大學、華中農業大學、鄭州大學、河南大學、長沙理工大學、湖北大學和湖北經濟學院等高效舉辦Stata編程培訓與實證研究方法分享,場場爆滿座無虛席

我們會繼續努力,以培養學生、技術研發為己任,在少量盈利的基礎上,努力將公益事業做好,傳播實證技術和數據分析方法、開發數據分析的工具等,造福于學術界!

?

主要授課老師簡介

李春濤,大學教授、博士生導師,香港大學博士,主要研究領域是公司治理和企業創新,在《經濟研究》、《金融研究》、Journal of Comparative Economics等主流期刊上發表學術論文三十余篇。李老師是Stata統計軟件的資深用戶,有20多年的Stata編程經驗,他有十多名學生正在或曾經在海外名校從事研究助理工作。

?

張川川,北京大學CCER經濟學博士,哈佛大學經濟系訪問研究員、世界銀行總部研究顧問。近年來在Journal of Population Economics、Health Economics、Demography等各領域頂級國際刊物和《中國社會科學》、《經濟研究》、《經濟學季刊》、《世界經濟》、《金融研究》等國內權威刊物發表中英文論文40余篇;主持國家自然科學基金、北京市社科規劃基金、霍英東高等院校青年教師基金和國家社科基金重大項目子課題等多項國家和省部級課題,并擔任50余本國內外學術刊物的匿名評審專家。


薛原,香港嶺南大學研究助理,爬蟲俱樂部高級成員,擅長Stata編程、正則表達式、字符串處理及網絡爬蟲技術。與李老師合作開發了chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,實現了中文地址與經緯度之間的轉換,中國上市公司股票代碼和分時交易數據的獲取以及修改文本文件,在《金融研究》發表過文章。

?

培訓對象

國內高校教師、碩士生、博士生、科研院所科研人員、大數據工作者,出國留學人員、社會團體及Stata愛好者。

?

培訓時間

2019.08.22-2019.08.24初級班

2019.08.25-2019.08.28高級班

?

培訓費用及優惠

image.png

(學生報名需提供有效學生證件)

培訓內容

初級班課程大綱

第一部分:初識Stata與數據讀入

1)熟悉界面

2)尋求幫助(在線幫助、搜索幫助等)

3)DOS命令(cd、dir、erase、rm、shell等)

4)Winexec調用windows系統相關操作

5)copy命令(文件操作、網頁源代碼讀取等)

6)Stata常用30個命令介紹

7)日期定義(日期格式設置、日期函數等)

8)函數(字符串函數、隨機函數、編程函數等)

9)egen函數與常見統計量

10) txt、csv、excel等格式文件讀入

11)Wind交易數據整理案例

12)基金經理變更數據整理案例

第二部分:宏與循環

1)local與global概念與基本操作

2)宏擴展函數

3)while、foreach、forvalue循環

4)跳出循環的continue 和continue, break

5)批量處理多個目錄下的多個文件(fs命令)

6)批量處理多個變量的多個取值(levelsof命令)

7)NBER工作論文下載案例

8)上交所年報爬取綜合案例

9)CSMAR交易和財務數據整理案例

第三部分:數據庫操作

1)數據的縱向合并、橫向合并與長寬變換

2) 工企數據庫運用案例

3) Wind財務數據整理案例

4)美國流行歌曲目錄整理案例

5)起死回生命令(preserve與restore)

6) CSSCI期刊目錄整理案例

7) label命令介紹

8) labelsof、label 的宏擴展函數

9)字符串處理(關鍵詞、替換、提取等)

第四部分:Post命令

1)post原理

2)定義post

3)用post計算股價同步性和Beta

4)基于網絡數據的事件研究

5)股本變更數據整理案例

第五部分:回歸分析及結果輸出

1)putdocx命令輸出內容至word文檔

? a)編輯docx文件中的文字內容

? b)輸出并編輯表格內容

? c)輸出內存中的list結果

? d)輸出矩陣

? e)輸出繪圖

2)putdocx命令相關案例

? a)輸出十進位制下的漢字unicode編碼

? b)結合常用漢字生成隨機漢字組成的段落

? c)爬取并輸出陜西省人大代表信息

3)實證結果輸出

? a)描述性統計信息:sum2docx

? b)分組均值t檢驗:t2docx

? c)相關系數矩陣:corr2docx

? d)回歸結果:reg2docx

4)實證結果輸出完整展示

?

高級班課程大綱

第一部分:正則表達式

1)正則表達式基本函數介紹

? a)ustrregexm()

? b)ustrregexs()

? c)ustrregexrf()與ustrregexra()

2)正則表達式元字符介紹

? a)基本元字符

? b)數量元字符

? c)位置元字符

? d)前后查找

? e)特殊字符元字符

? f)回溯引用

? g)unicode編碼

3)正則表達式匹配模式

? a)貪婪模式

? b)懶惰模式

4)正則表達式例子

? a)郵編提取

? b)英文姓與名的拆分

? c)CSSCI數據預處理

? d)百度新聞數量

? e)城市名稱提取

? f)pdf表格數據的提取

? g)英文姓名的拆分

? h)用正則表達式提取日期

? i)北大法寶裁判文書信息提取

5)正則表達式相關命令

? a)moss命令與簡單的詞頻統計

? b)subinfile命令對文本文檔進行操作

第二部分:網絡爬蟲

1)爬蟲初步

? a)新浪高管任職數據抓取

? b)NBER Working Paper信息的抓取

? c)百度地圖api調用

2)尋找真實鏈接

? a)和訊網港股數據

? b)深交所信息披露質量

? c)百度新聞逐年數據獲取

3)調用curl

? a)新浪財經港股數據獲取

? b)環保部AQI獲取

第三部分:文本分析

1)分詞原理

2)分詞的實現

? a)ustrwordcount()和ustrword()

? b)調用Python的jieba和pynlpir

? c)Bosonnlp的API

? d)詞頻統計

3)高亮輸出文章重點

4)詞云圖的實現

5)情感分析原理

6)情感分析的實現

? a)年報MDA語調分析

? b)構建詞庫計算情感值

? c)大眾點評日料評論情感分析

第四部分:實證研究方法

? 1)?工具變量方法(IV)

? a)工具變量方法介紹

? b)現代IV方法:LATE

? c)IV方法應用一般步驟:論文案例與Stata實操

2)?斷點回歸方法(RD)

? a)RD方法思想和方法演進

? b)精準斷點(Shape RD)與模糊斷點(Fuzzy RD)

? c)RD方法應用一般步驟:論文案例與Stata實操

3)?倍差法(DID)

? a)DID模型設定、參數估計和假設檢驗

? b)DID方法與固定效應估計(FE):聯系和區別

? c)IV方法應用一般步驟:論文案例與Stata實操

? d)DDD(三重差分)方法介紹與應用

? e)DDD論文案例與Stata實操

?

注意事項及培訓安排

1.請學員自帶筆記本電腦,我們將提供Stata原廠軟件試用程序。

2.本次培訓食宿及往返交通費用學員自理。

3.即日起開始正式報名和收費。

?

報名方式

掃描下方二維碼提交報名信息→繳費→發送繳費截圖至[email protected](郵件主題為“爬蟲俱樂部2019暑期Stata培訓+姓名+單位+班次”)→報名成功。

image.png


支付方式

?

對公轉賬

開戶名:武漢字符串數據科技有限公司

開戶行:中國銀行股份有限公司武漢中南財經政法大學分理處

對公賬號:579473738265

對私轉賬

支付寶:13237670191(楊慧琳)

?

科學軟件網Stata軟件在中國的授權經銷商,提供Stata軟件銷售、培訓和研討會服務。我們每年都會舉辦Stata軟件免費公益培訓,歡迎大家關注我們的公眾號天演融智,了解更多資訊。


?


腾讯欢乐捕鱼大战攻略 天谕跑商最赚钱的路线 电脑版单机捕鱼达人 高频彩稳定赚钱 成都皮皮麻将微信群 写情感文章赚钱的公众号 地下城勇士的决战者怎么加点 怎么通过买鞋赚钱吗 天鸽彩金捕鱼安卓版 开长途客车赚钱吗 利升宝彩票首页 年轻人2019搞什么会赚钱 全民玩麻将辅助器 mysql安装教程赚钱 qq幻想 赚钱吗 8号彩票游戏