节点配置

节点内按步骤配置，执行时会按顺序依次执行
步骤 0 为数据源，必须配置，后续步骤自行添加
步骤支持命名、删除、排序

数据源

选择数据集：
- 选择需要操作的前序数据集节点
- 提供快速跳转按钮，可以定位至该数据集节点的配置界面
别名：非必填，可为该节点定义别名，后续引用时可以使用别名

步骤分类

目前支持的步骤包括：

分类	分类描述	步骤	用途
行操作	仅改变原数据集的行数，不影响列数	行过滤	按条件筛选数据
		行去重	全部列或指定列的数据重复时，删除重复行
		行排序	按指定列升序或降序排列数据
		行选择	按目前排序，仅挑选第几行到第几行的数据
列操作	增减原数据集的列，不改变行数	列选择	仅保留需要的字段，或排除不需要的字段并保留剩余字段
		列类型转换	+ 增加新列，如果定义的新列字段名与原有列重名，则覆盖原有列 + 转换已有列为指定的类型
		列计算	+ 增加新列，如果定义的新列字段名与原有列重名，则覆盖原有列 + 输入 SQL 表达式，语法需要符合 DuckDB 要求
		列计算-窗口	+ 增加新列，如果定义的新列字段名与原有列重名，则覆盖原有列 + 适配复杂场景案例：针对【成绩单】数据，按【学科】分组，按【分数】排序，应用`rank`函数，以得到【名次】 + 功能简介：支持将某些字段相同的数据，整理为一个窗口（即分组），窗口/组内再排序，再对这个窗口应用窗口函数，例如排名、取首行值、取末行值···
		列计算-窗口聚合	+ 增加新列，如果定义的新列字段名与原有列重名，则覆盖原有列 + 适配复杂场景案例：累加/分组累加计算、移动平均、分组聚合后拼接回原始表、PAC平均成本法 + 功能简介：支持先分组、组内排序，然后定义窗口大小，对这个窗口应用聚合函数，例如求和、计数、平均值···
集合	原数据集的行列可能都被影响	聚合	+ 增加新列，如果定义的新列字段名与原有列重名，则覆盖原有列 + 适配复杂场景案例：每个`类型`按`价格`倒序排的前5条数据的平均值 + 功能简介：支持先分组、组内排序，然后挑选组内数据，最后对每个组内的数据应用聚合函数，例如求和、计数、平均值···
		连接(join)	再选择一个前序数据集节点作为`右表`，将其与数据源（`左表`）进行连接，需要选择连接方式和匹配字段
		集合(union)	再选择一个前序数据集节点，将其与数据源计算`并集`/`交集`/`差集`

行过滤

使用条件编排器进行过滤条件编排（详见DPL_专用编辑器）

行去重

行去重依据
- 全部：仅当全部列的值完全相同时，视为重复数据
- 指定列：选择某几列，当这几列的值完全相同时，视为重复数据
重复时，行保留选项：
- 保留第一项：只保留第一项，其余的行删除
行排序：
- 针对于【保留第一项】，可以对【第一】进行排序，例如按金额倒序排序，则金额最大的则成为第一，实现保留金额最大的选项

行排序

按指定列升序或降序排列，多个字段间排序的优先级顺序可拖拽调整

行选择

选择从第几行到第几行，常用排序后保留前几条数据的场景。

从：可选首行或输入第几行
至：可选末行或输入第几行

列选择

当数据的无用列较多时，可以正向选择要保留哪些列，或者排除哪些不需要的列只保留剩下的列。

PS：排除指定列对于存在列拓展的情况更为友好。例如：原始列A、B、C，排除列C，则本步骤后，只保留列A、B，若后续列扩展为A、B、C、D，无需修改配置，会自动添加列D，得到列A、B、D。

列类型转换

用于将原字段的类型转为指定类型，需要为转换后的字段命名，若与已有字段重名，会覆盖原字段。

date、datetime类型的字段转为text类型字段时，需指定转换后的日期时间格式。其中，%Y表示年，%m表示月，%d表示日等。

列计算

利用SQL计算得到新字段，需要为新字段命名，若与已有字段重名，会覆盖原字段。

SQL语法需要符合 DuckDB 要求，请参考其官方文档：SQL Introduction。

SQL中可以使用参数，参数需要用双花括号{{}}占位，并在括号中定义参数名。
在参数赋值框中，输入PY表达式，为定义的参数赋值，PY表达式中可以使用数据流的预置变量，例如启动参数或前序节点的输出结果等。

列计算-窗口

窗口函数就像是给数据开了一个”观察窗口”，让你能够在不改变原始数据行数的情况下，对数据进行分组计算和分析。

想象你在教室里看成绩单：

普通聚合函数(如SUM、AVG)就像老师宣布全班平均分
窗口函数则像是给每个学生发一张小纸条，上面写着：”你的语文分数是X1，全班平均分是Y1，你在全班排名第Z1；你的数学分数是X2，全班平均分是Y2，你在全班排名第Z2”

排名函数包括：

row_number - 不重复的连续排名：即使值相同，也会拥有不同排名
rank - 等值并列的跳跃排名：值相同的排名一定相同，当出现多个排名相同的，例如有N个相同，下一个排名会出现跳跃，在当前排名上会+N
rank_dense - 等值并列的连续排名：值相同的排名一定相同，当出现多个排名相同的，下一个排名在当前排名上仅+1

这三种排名的区别，举例说明：

first - 首行值用于取窗口中的第一行中，指定列的值。例如取成绩单上的最高分、最低分等。

列计算-窗口聚合

与列计算-窗口的思路相同，只是在列计算-窗口的基础上：

提供了更多与聚合相关的函数。例如：sum - 求和、count - 计数、count_distinct - 去重计数、min - 最小值、max - 最大值、average - 平均值、stddev - 标准差、all - 与、any - 或
可以指定分组后的窗口大小。例如，选择从首行到当前行作为窗口大小，来实现至今累计

PS：指定窗口大小时，0表示当前行，-N表示往前第N行，N表示往后第N行，..前的数字省略表示从首行，..后的数字省略表示至末行