使用 Excel 分析非连续竞价的价格趋势

步骤 1:数据准备与预处理

1、整理数据:将数据整理成表格,至少包含两列:一列是竞价的日期或时间,另一列是价格。若有其他相关数据(如产品品质、原材料成本、季节性因素等),也应一并放入表格。

2、创建时间特征:为了让 Excel 理解时间的线性关系,需要创建一个辅助列来表示“天数”,即从第一笔交易开始到每笔交易的天数。在新的单元格中,输入公式 =A2-$A$2 (假设您的日期在 A 列),然后将公式下拉填充。这会将日期转换为一个数字序列。 

步骤 2:数据可视化

1、插入散点图:选中包含“天数”和“价格”的两列数据,然后选择“插入”>“图表”>“散点图”。

2、观察趋势:散点图将直观地展示价格随时间(天数)的变化情况。由于是非连续数据,图表上会出现间隔,但您仍能看出整体的价格走势(上升、下降或波动)。 

步骤 3:利用回归分析识别趋势

1、安装数据分析工具库:如果您的 Excel 中没有“数据分析”选项,需要先安装。

点击“文件”>“选项”>“加载项”。

在“管理”下拉菜单中选择“Excel 加载项”,点击“转到”。

勾选“分析工具库”,点击“确定”。

2、运行回归分析:

点击“数据”选项卡,选择“数据分析”。

在弹出的窗口中选择“回归”。

在“输入 Y 值区域”中选择您的“价格”列数据。

在“输入 X 值区域”中选择您的“天数”列数据。

勾选“标签”(如果您的数据包含标题行)。

选择一个“输出区域”来放置分析结果,然后点击“确定”。

3、解读回归结果:

P 值:检查自变量(天数)的 P 值,如果它远小于 0.05,则表明时间对价格有显著影响。

系数:查看“天数”的系数,正值表示价格随时间上升,负值表示下降。该系数的大小反映了趋势的斜率。

R 方:R 平方值衡量了模型对价格变化的解释程度,值越接近 1,模型拟合得越好。

步骤 4:趋势预测与平滑

1、使用 FORECAST 函数:利用 FORECAST 或 FORECAST.LINEAR 函数,您可以根据历史数据预测未来某个日期的价格。

公式为 =FORECAST.LINEAR(x, Known_y's, Known_x's),其中 x 是您想预测的未来天数,Known_y's 是您的价格数据,Known_x's 是天数数据。

2、计算移动平均:尽管数据非连续,您仍可计算移动平均来平滑价格波动,更好地观察潜在趋势。

使用 AVERAGEIFS 函数,可以指定日期范围来计算移动平均,例如,计算过去 7 天内的平均价格。 

一个具体的模型分析方法(以结合外部因素的回归分析和针对稀疏数据的机器学习模型为例)和步骤

核心挑战在于数据稀疏性。我们需要引入辅助信息(协变量)并利用适合非线性或不规则数据的模型。

步骤 1: 数据收集与预处理

1、收集数据: 收集每次竞价的交易时间、最终价格、数量、产品特征(例如品质、尺寸、品牌)以及可能的外部因素(例如原材料价格、市场指数、季节性指标、宏观经济数据)。

2、清洗与整合: 处理缺失值和异常值。将非结构化数据转化为结构化格式。

3、特征工程: 创建新的有意义的特征,例如:

◦距上次交易的时间间隔(表示市场活跃度)

◦一周中的某天/一年中的某月(捕捉周期性)

◦历史平均价格的移动平均值

4、时间戳对齐: 由于交易不连续,需要一个时间参照系。可以将数据聚合到固定的时间窗口(例如每天、每周的平均/中位数价格),或者在建模时使用精确的时间戳作为协变量。 

 

步骤 2: 选择合适的模型

根据数据量和复杂性,可以选择以下模型:

•模型 A: 多元线性回归/广义线性模型 (GLM)

◦优点: 易于解释,计算快速。

◦核心思想: 将价格作为产品特征、外部因素和时间相关变量的线性函数。

◦适用场景: 数据相对规则,或仅关注长期、宏观的趋势。

•模型 B: 针对稀疏数据的机器学习回归模型(如 Random Forest, Gradient Boosting, 或 SVR)

◦优点: 能捕捉复杂的非线性关系和交互作用,通常预测准确率更高。

◦核心思想: 利用历史数据中的多种特征(包括时间、外部因素、产品属性)来预测未来的价格或趋势。 

 

步骤 3: 模型构建与训练 (以模型 B 为例)

1、划分数据集: 将数据分为训练集、验证集和测试集(注意时间顺序,避免使用未来数据预测过去)。

2、特征选择: 使用递归特征消除 (RFE) 或基于模型的特征重要性评估来挑选最重要的预测因子。

3、模型训练: 使用训练集数据训练选定的机器学习模型。

4、参数调优: 使用交叉验证技术(如时间序列交叉验证)调整模型参数,例如 Gradient Boosting 中的树的数量、深度和学习率。

 

步骤 4: 趋势分析与解释

1、模型评估: 在测试集上评估模型的性能(使用均方误差 RMSE、平均绝对误差 MAE 等指标)。

2、趋势识别:

◦通过分析模型中时间相关特征(如日期、季节性指标)的系数或特征重要性,确定是否存在显著的上升或下降趋势。

◦通过绘制模型的预测价格曲线与实际价格散点图,直观地观察长期趋势。

◦分析外部因素(如原材料价格)对产品价格的影响程度,这有助于理解趋势背后的驱动力。

3敏感性分析: 模拟不同外部因素变化情景下(例如原材料价格上涨10%),模型预测的产品价格趋势如何变化。

非连续竞价(例如在拍卖、非频繁交易市场或集合竞价中)的数据通常稀疏且不规则,这使得传统的连续价格趋势分析方法难以直接应用。跟踪同类产品非连续竞价价格趋势可以采用以下几种方法:

1. 数据预处理与可视化

•时间序列化: 将每次竞价交易按时间顺序排列,记录交易时间、价格和数量。

•数据清洗: 剔除异常值,例如明显错误的输入或极小概率的操纵价格。

•可视化: 使用散点图或阶梯图直观展示价格随时间的变化,初步观察是否存在趋势或周期性。

 

2. 统计分析方法

•移动平均(MA): 尽管数据非连续,仍可使用基于时间的(如过去7天或30天内的交易)或基于交易次数的移动平均来平滑价格数据,帮助识别长期趋势。

•描述性统计: 计算特定时间段内的平均价格、中位数价格、价格波动范围(最大值、最小值、标准差),通过比较不同时间段的统计数据来判断趋势。

•回归分析: 尝试使用线性回归或多项式回归模型,将价格作为时间的函数进行拟合。这有助于识别是否存在上升、下降或平稳的长期趋势。

 

3. 趋势识别与模式匹配

•周期性分析: 对于具有特定拍卖周期的产品(例如每周拍卖一次),分析每个周期内的价格中位数或平均值,寻找跨周期的趋势。

•支撑与阻力位: 观察历史交易中价格经常触及但未能突破的水平,这些水平可能预示着趋势的潜在转折点或巩固区域。

•与原材料或相关市场趋势对比: 价格趋势通常与原材料成本或相关(可能更具流动性的)市场价格走势一致。对比这些外部因素有助于验证观察到的趋势。 

 

4. 高级模型(如果数据量足够)

•机器学习模型: 使用时间序列预测模型(如 ARIMA 或指数平滑法)的变体,或针对不规则时间序列设计的特定算法来预测未来价格。

•事件研究法: 分析特定事件(如新产品发布、政策变化)对竞价价格的短期和长期影响,这些影响累积起来可能形成趋势。

想让我根据特定产品的竞价频率或数据特点,推荐更具体的分析工具或统计模型吗?

实例方法论

通过对固化ID、地域、产品、中标单价、基准价、批次,这几个关键数据进行3年数据的收集及分析是否可以找到相应的合理值,如果用Excel进行统计处理,需要用什么方法,具体步骤有哪些,能提供详细的说明吗?

通过对固化ID、地域、产品、中标单价、基准价、批次这几个关键数据进行3年数据的收集及分析,是可以找到相应的合理值的。合理值可能包括: 

•价格合理性: 分析中标单价与基准价的偏差,判断是否存在价格异常或波动。

•成本分析: 结合地域、产品和批次,评估不同条件下的成本变化。

•趋势预测: 观察3年内价格的变化趋势,为未来价格预测提供参考。

•异常值检测: 识别价格异常波动,调查其原因。

以下是用 Excel 进行统计处理的方法和具体步骤。 

 

方法论:核心是多维度交叉分析

1交叉分析:通过将不同维度(地域、产品、批次)与价格数据(中标单价、基准价)进行组合,找出它们之间的关联性。

2趋势分析:利用3年时间跨度的数据,观察价格随时间的变化规律。

3对比分析:将中标单价与基准价进行对比,计算差异,判断价格的合理性。

4异常值分析:通过统计方法找出价格数据中的异常值,并进一步分析其原因。

 

具体步骤

 

第一步:数据收集与准备

1数据收集:将3年内所有中标项目的数据收集到 Excel 工作表中。

2数据清洗:

◦标准化:确保所有数据格式统一,如日期格式、价格单位等。

◦去重:删除重复的记录,确保数据的唯一性。

◦检查缺失值:处理或标记缺失的数据。

3创建字段:

◦在 Excel 中建立如下列:固化ID、地域、产品、中标单价、基准价、批次、中标日期。

◦新增辅助列:为了方便分析,可以增加一些计算列,例如:价格差异 = 中标单价 - 基准价,差异百分比 = 价格差异 / 基准价。

 

第二步:数据透视表进行多维度分析

数据透视表是 Excel 中进行交叉分析最强大的工具。

1创建数据透视表:

◦选择整个数据区域。

◦点击 插入 -> 数据透视表。

2分析价格趋势:

◦将 中标日期 拖到 行 区域,并按年、季、月进行分组。

◦将 中标单价 拖到 值 区域,选择 平均值。

◦观察:通过数据透视表,你可以看到过去3年平均中标价格随时间的变化趋势。

3分析产品和地域差异:

◦将 地域 和 产品 拖到 行 区域。

◦将 中标单价 和 基准价 拖到 值 区域(求平均值)。

◦观察:比较不同地域和产品的平均中标价与基准价,找出价格差异较大的组合。

4分析批次影响:

◦将 批次 拖到 行 区域,将 中标单价 拖到 值 区域。

◦观察:分析不同批次的价格波动情况。

 

第三步:使用函数进行价格合理性分析

除了数据透视表,也可以使用 Excel 函数进行更精细的分析。

1计算价格差异:

◦在辅助列中,使用公式 $C2-$D2(假设中标单价在 C 列,基准价在 D 列)计算价格差异。

2统计平均值、标准差:

◦使用 AVERAGE() 函数计算特定地域、产品或批次的平均价格。

◦使用 STDEV.P() 函数计算价格的标准差,了解价格的波动程度。

3条件格式突出异常:

◦选中 价格差异百分比 列。

◦点击 开始 -> 条件格式 -> 突出显示单元格规则。

◦设置规则,例如:如果差异百分比大于某个阈值(如10%),则突出显示为红色。

 

第四步:图表可视化

图表能更直观地展示分析结果。

1趋势图:

◦根据数据透视表的结果,创建折线图,展示3年内价格的变化趋势。

2对比图:

◦创建柱状图或条形图,对比不同地域、产品或批次的平均中标价与基准价。

3箱型图(通过插件实现):

◦如果数据分布复杂,可以安装 Excel 插件(如 XLSTAT),创建箱型图,直观地展示价格的中位数、四分位数和异常值。

 

第五步:结果解读与合理值判断

根据以上分析结果,进行综合判断。

•价格波动:如果某个产品或地域的价格在3年内持续稳定,那么其平均价可以作为重要的合理参考值。

•异常值:找出被条件格式标记的异常价格,深入分析其原因。如果发现某个地域的基准价偏低,导致中标价差异大,那么可以推断基准价本身可能存在问题。

•关联性:如果发现某些特定批次的产品价格波动较大,可能与市场供需或原材料价格有关。

•综合评估:结合所有分析结果,对每个产品、地域或批次给出一个综合的价格合理区间,而不是单一的合理值。例如,某个产品在特定地域的合理中标价应在基准价的 +/- 5% 范围内。

其他工具选择

商业智能(BI)工具

BI工具侧重于商业数据的可视化和洞察,操作界面友好,适合制作交互式仪表盘,方便非技术人员理解数据。

•Microsoft Power BI: 与Excel同属微软产品,可以轻松导入Excel数据进行更深度的可视化和交互式分析。对于熟悉微软生态的用户来说,上手门槛较低。

•Tableau: 以强大的数据可视化能力著称,能够快速创建美观且富有洞察力的图表和仪表盘,帮助你直观地发现价格数据中的趋势和异常。

•FineBI/帆软: 国产BI工具,功能全面,能够处理复杂数据,支持制作酷炫的图表和大屏,且具备强大的数据权限管理功能,适合企业级应用。 

 

编程语言

如果你的数据量非常庞大,或者需要进行更复杂的统计建模和预测,编程语言是更好的选择。

•Python: 拥有丰富的数据分析库,如Pandas用于数据处理,NumPy用于数值计算,Matplotlib和Seaborn用于数据可视化。

◦优点: 灵活性强,可以进行高级统计分析、机器学习等,且社区支持丰富。

◦缺点: 需要一定的编程基础,学习曲线相对较陡。

•R语言: 专为统计分析和数据可视化而设计,拥有强大的统计功能和丰富的图表库(如ggplot2)。 

 

统计分析软件

这类软件功能强大,专门用于复杂的统计分析,但通常需要付费。

•SPSS (IBM): 专门用于社会科学领域的统计分析软件,界面相对直观,适合进行回归分析、方差分析等复杂统计。

•SAS: 功能强大的高级分析软件,主要用于企业级数据处理和分析。 

 

在线协作表格

如果你的团队需要多人协同处理和分析数据,在线表格是很好的选择。

•Google Sheets: 类似Excel的在线表格工具,支持多人实时协作,可以轻松地进行数据共享和简单的分析。

•Airtable: 将电子表格和数据库功能结合,能够更灵活地管理数据,并进行可视化,适合项目管理和内容管理。 

关于选择

如何选择合适的辅助工具?

1、数据规模: 如果数据量不大,Excel基本够用。如果数据量大到Excel打开都困难,则应考虑Python、BI工具或数据库。

2、技术能力: 如果团队成员不具备编程基础,BI工具(如Power BI、Tableau)是更友好的选择。

3、分析深度: 如果需要进行高级统计建模或预测,编程语言(Python、R)或专业统计软件(SPSS)是必选。

4、可视化要求: 如果对图表的交互性和美观度有较高要求,Tableau、Power BI是更好的选择。

5、协作需求: 如果需要多人在线协作,Google Sheets或Airtable更具优势。

--END--