更新日志
所有重要的变更都将记录在此文件中。
版本 0.1.5 (2026-02-14)
新增功能
大数据优化
添加
LargeDataConfig大数据配置类添加
smart_sample()智能采样函数(支持随机/分层采样)添加
chunked_correlation()分块计算相关性添加
chunked_apply()分块应用函数添加
optimize_dataframe()内存优化函数添加
is_large_data()大数据检测函数添加
estimate_memory_usage()内存估算函数CorrAnalyzer 支持大数据配置参数
半偏相关分析
添加
semipartial_corr()半偏相关(部分相关)函数
改进
优化大数据集的自动检测和提示
改进内存使用效率
更新项目结构为 src 布局
版本 0.1.0 (2026-02-13)
首次发布
这是 PyCorrAna 的首个正式版本。
新增功能
核心分析功能
添加
quick_corr()一键分析函数添加
CorrAnalyzer分析器类支持自动方法选择(Pearson/Spearman/Kendall/Cramér's V/Eta等)
支持显著性检验和 p 值校正
数据预处理
支持多种数据格式(CSV/Excel/pandas/polars)
自动类型推断
缺失值处理(删除/填充)
异常值检测
可视化
相关性热力图(支持聚类)
散点图矩阵
箱线图/小提琴图
相关网络图
结果导出
Excel 导出
CSV 导出
文本摘要
偏相关分析
partial_corr()偏相关系数计算partial_corr_matrix()偏相关矩阵PartialCorrAnalyzer分析器类
非线性分析
distance_correlation()距离相关mutual_info_score()互信息maximal_information_coefficient()MICNonlinearAnalyzer分析器类
命令行工具
pycorrana analyze完整分析pycorrana clean数据清洗pycorrana partial偏相关分析pycorrana nonlinear非线性检测pycorrana-interactive交互式工具
示例数据集
鸢尾花数据集 (iris)
泰坦尼克数据集 (titanic)
葡萄酒数据集 (wine)
模拟数据生成器