lookat 2019-11-17
Tushare是一个免费、开源的python财经数据接口包,目前为Tushare Pro版本,主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据。Tushare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas、NumPy、Matplotlib进行数据分析和可视化。
Github: https://github.com/waditu/Tushare
pip install tushare lxml pip install beautifulsoup4
Tushare使用需要注册账户,并生成Token。
本人邀请注册链接:https://tushare.pro/register?reg=306303
注册成功,登录Tushare,点击个人信息设置:
在接口Token页找到个人的Token,Token是使用Tushare接口的惟一凭证,如果发现泄露,可以刷新生成新的Token。
import tushare as ts if __name__ == ‘__main__‘: print(ts.__version__) # 设置Token ts.set_token(‘xxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() # output: # 1.2.45
Tushare的数据接口分为沪深股票、指数、基金、期货、期权、债券、外汇、港股、行业经济、宏观经济、特色大数据共计十一大类,沪深其中股票分为基础数据、行情数据、财务数据、市场参考数据四类接口。Tushare也提供了区块链相关的基础数据、行情数据、资讯公告三类接口,以及新浪财经、东方财富、同花顺、云财经、华尔街见闻等财经网站的宏观经济、外汇、A股、区块链、美股、石油、黄金、黄金外汇、港股、商品、债券、公司、市场、焦点、央行等财经资讯类消息。
Tushare API接口需要根据注册账户的积分数量获取相应的访问权限,积分等级不够可能导致API接口无权限访问,区块链相关接口需要捐款获取相应权限。
Tushare API接口使用参考:https://tushare.pro/document/2
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.stock_basic(exchange=‘‘, list_status=‘L‘, fields=‘ts_code,symbol,name,area,industry,list_date‘) # data = ts_api.query(‘stock_basic‘, exchange=‘‘, list_status=‘L‘, # fields=‘ts_code,symbol,name,area,industry,list_date‘) print(data)
获取股票基础信息数据,包括股票代码、名称、上市日期,行业、概念等。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.new_share(start_date=‘20190101‘, end_date=‘20190901‘) print(data)
获取新股上市列表数据
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.daily(ts_code=‘000001.SZ‘, start_date=‘20190101‘, end_date=‘20190901‘) print(data)
交易日每天15点~16点之间。本接口是未复权行情,停牌期间不提供数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.weekly(ts_code=‘000001.SZ‘, start_date=‘20180101‘, end_date=‘20181101‘, fields=‘ts_code,trade_date,open,high,low,close,vol,amount‘) print(data)
获取A股周线行情
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.monthly(ts_code=‘000001.SZ‘, start_date=‘20180101‘, end_date=‘20181101‘, fields=‘ts_code,trade_date,open,high,low,close,vol,amount‘) print(data)
获取A股月线数据。
pro_bar接口整合了股票(未复权、前复权、后复权)、指数、数字货币、ETF基金、期货、期权的行情数据,未来会包括外汇在内的所有交易行情数据,同时提供分钟数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts.pro_bar(api=ts_api, ts_code=‘000009.SZ‘, adj=‘qfq‘, start_date=‘20170101‘, end_date=‘20181011‘, ma=[5], freq=‘D‘) print(data)
获取A股的K线数据,带有复权参数“adj”、均线参数“ma”、数据频度参数“freq”。
import tushare import os import datetime import timedelta def fetch_kline_data(code): filename = ‘your path‘ if not os.path.exists(filename): end_date = datetime.strftime(datetime.now(), ‘%Y%m%d‘)#获取当前时间 outputflag = True api = tushare.pro_api() while outputflag:#循环判断,直到返还的数据为空 data = tushare.pro_bar(pro_api=api,ts_code=code, end_date=end_date,asset=‘E‘, adj=None, freq=‘D‘) if data.empty == True: outputflag = False else: #计算下次请求数据的截止日期 next_end_date = datetime.strptime(data.iloc[-1][‘trade_date‘], ‘%Y%m%d‘) - timedelta(hours=24) end_date = datetime.strftime(next_end_date, ‘%Y%m%d‘) #写csv文件 if os.path.exists(filename): data.to_csv(filename, header=None, mode=‘a‘)#追加写入模式 else: data.to_csv(filename, header=None, mode=‘a‘)
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘xxxx0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.income(ts_code=‘600001.SH‘, start_date=‘20190101‘, end_date=‘20190901‘) print(data)
获取上市公司财务利润表数据
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.balancesheet(ts_code=‘600000.SH‘, start_date=‘20190101‘, end_date=‘20190901‘, fields=‘ts_code,ann_date,f_ann_date,end_date,report_type,comp_type,cap_rese‘) print(data)
获取上市公司资产负债表。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.cashflow(ts_code=‘600000.SH‘, start_date=‘20190101‘, end_date=‘20190901‘) print(data)
获取上市公司现金流量表。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.forecast(ann_date=‘20190131‘, fields=‘ts_code,ann_date,end_date,type,p_change_min,p_change_max,net_profit_min‘) print(data)
获取业绩预告数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.dividend(ts_code=‘600848.SH‘, fields=‘ts_code,div_proc,stk_div,record_date,ex_date‘) print(data)
分红送股数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.express(ts_code=‘600000.SH‘, start_date=‘20180101‘, end_date=‘20180701‘, fields=‘ts_code,ann_date,end_date,revenue,operate_profit,total_profit,n_income,total_assets‘) print(data)
获取上市公司业绩快报。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.fina_indicator(ts_code=‘600000.SH‘) print(data)
获取上市公司财务指标数据,为避免服务器压力,现阶段每次请求最多返回60条记录,可通过设置日期多次请求获取更多数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.fina_audit(ts_code=‘600000.SH‘, start_date=‘20100101‘, end_date=‘20180808‘) print(data)
获取上市公司定期财务审计意见数据
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.fina_mainbz(ts_code=‘000627.SZ‘, type=‘P‘) print(data)
获取某只股票的主营业务构成df = ts_api.fina_mainbz_vip(period=‘20181231‘, type=‘P‘, fields=‘ts_code,end_date,bz_item,bz_sales‘)
获取某一季度全部股票的主营业务构成
import tushare import datetime import os import timedelta def fetch_finance_indicator(code): filename = ‘your path‘ if not os.path.exists(filename): end_date = datetime.strftime(datetime.now(), ‘%Y%m%d‘) outputflag = True api = tushare.pro_api() while outputflag: data = api.fina_indicator(ts_code=code, end_date=end_date) if data.empty == True: outputflag = False else: next_end_date = datetime.strptime( data.iloc[-1][‘end_date‘], ‘%Y%m%d‘) - timedelta(hours=24) end_date = datetime.strftime(next_end_date, ‘%Y%m%d‘) if os.path.exists(filename): data.to_csv(filename, header=None, mode=‘a‘) else: data.to_csv(filename)
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.index_basic(market=‘CSI‘) print(data)
获取指数基础信息。
MSCI:MSCI指数
CSI:中证指数
SSE:上交所指数
SZSE:深交所指数
CICC:中金所指数
SW:申万指数
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.index_daily(ts_code=‘399300.SZ‘, start_date=‘20190101‘, end_date=‘20190910‘) print(data)
获取指数每日行情,还可以通过bar接口获取。由于服务器压力,目前规则是单次调取最多取8000行记录,可以设置start和end日期补全。指数行情也可以通过通用行情接口获取数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.index_weekly(ts_code=‘000001.SH‘, start_date=‘20180101‘, end_date=‘20190329‘, fields=‘ts_code,trade_date,open,high,low,close,vol,amount‘) print(data)
获取指数周线行情,单次最大1000行记录,可分批获取,总量不限制。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.index_monthly(ts_code=‘000001.SH‘, start_date=‘20180101‘, end_date=‘20190930‘, fields=‘ts_code,trade_date,open,high,low,close,vol,amount‘) print(data)
获取指数月线行情,每月更新一次,单次最大1000行记录,可多次获取,总量不限制。用户需要至少600积分才可以调取,积分越多频次越高。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.index_weight(index_code=‘399300.SZ‘, start_date=‘20180901‘, end_date=‘20190930‘) print(data)
获取各类指数成分和权重,月度数据?,如需日度指数成分和权重,用户需要至少400积分才可以调取。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.ggt_top10(trade_date=‘20190925‘) print(data)
获取港股通每日成交数据,其中包括沪市、深市详细数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.margin(trade_date=‘20190925‘) print(data)
获取融资融券每日交易汇总数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.margin_detail(trade_date=‘20190925‘) print(data)
获取沪深两市每日融资融券明细。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.top10_holders(ts_code=‘600000.SH‘, start_date=‘20190101‘, end_date=‘20191231‘) print(data)
获取上市公司前十大股东数据,包括持有数量和比例等信息。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.top10_floatholders(ts_code=‘600000.SH‘, start_date=‘20190101‘, end_date=‘20191231‘) print(data)
获取上市公司前十大流通股东数据。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.top_list(trade_date=‘20190925‘) print(data)
龙虎榜每日交易明细,单次最大10000,用户需要至少300积分才可以调取。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.top_inst(trade_date=‘20190925‘) print(data)
龙虎榜机构成交明细,单次最大10000,用户需要至少300积分才可以调取。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.block_trade(trade_date=‘20190925‘) print(data)
大宗交易,单次最大1000条,总量不限制,300积分可调取,每分钟内限制次数,超过5000积分无限制。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.stk_account(start_date=‘20190101‘, end_date=‘20191231‘) print(data)
获取股票账户开户数据,统计周期为一周,600积分可调取。
import tushare as ts if __name__ == ‘__main__‘: # 设置Token ts.set_token(‘b31e0ac207a5a45e0f7503aff25bf6bd929b88fe1d017a034ee0d530‘) # 初始化接口 ts_api = ts.pro_api() data = ts_api.stk_holdernumber(ts_code=‘300209.SZ‘, start_date=‘20190101‘, end_date=‘20191231‘) print(data)
获取上市公司股东户数数据,数据不定期公布。单次最大3000,总量不限制,600积分可调取,基础积分每分钟调取100次,5000积分以上无限制。