✍️ 朱邓达 , 田冬冬  •  📅 2025-05-28

sample1d

官方文档:

sample1d

简介:

对 1D 表数据进行重采样

语法

gmt sample1d [ table ] [ -A[f|p|m|r|R][+d][+l] ] [ -C[section/]master|cpt|color\(_1\),color\(_2\)[,color\(_3\),…][+h[hinge]][+idz][+u|Uunit][+sfname] ] [ -E ] [ -Fa|c|e|l|n|sp[+d1|2] ] [ -Ncol ] [ -T[min/max/]inc[+a][+i|n][+u] | [-Tfile|list]] [ -V[level] ] [ -Wcol ] [ -bbinary ] [ -dnodata[+ccol] ] [ -eregexp ] [ -fflags ] [ -ggaps ] [ -hheaders ] [ -iflags ] [ -jflags ] [ -oflags ] [ -qflags ] [ -sflags ] [ -wflags ] [ -:[i|o] ] [ --PAR=value ]

描述

sample1d 从文件(或标准输入)读取一个多列的 ASCII 格式(或二进制)数据, 对时间序列或指定测线点位进行重采样。其中独立变量 (即单调递增或递减的变量,以下称之为 time ) 默认位于首列,用户可指定其他列作为独立变量。可以使用等距或其他指定采样。 所有列都将基于新的采样间隔重新采样。除平滑样条 (smoothing spline)方法外, 还可选择多种插值方法。其中,平滑样条通过在拟合误差和曲率之间进行权衡 (即不完全精确拟合数据点以换取更平滑的曲线)来实现平滑效果。 本模块不支持输入数据范围外做外推插值。通过使用 -C 指定 CPT, 本模块将基于输入数据最后一列做颜色插值,将 r,g,b,a 添加到输出。

必选选项

table

一个或多个ASCII或二进制表数据。若不提供表数据,则会从标准输入中读取。

可选选项

-A[f|p|m|r|R][+l]

关于沿测线进行采样(如果设置了 -Tunit )的一些选项,在 -A 后追加:

  • f - 沿测线采样,保留原始点位,按需会适当插值线段中点(默认)。

  • m - 类似 f ,但测线变为阶梯状,先沿经度采样,再沿纬度采样。

  • p - 类似 f ,但测线变为阶梯状,先沿纬度采样,再沿经度采样。

  • r - 等距采样,此时输入的点位(尤其是端点)可能不会严格包括在输出结果中。

  • R - 类似 r ,但会适当调整采样点间距使输入点位都在输出结果中。

还支持以下选项:

  • +d - 删除重复输入记录(即 time 没变化)。

  • +l - 使地理距离的测量沿着恒向线(rhumb lines 或 loxodromes , 即沿着该方向行进时行进方向始终与经线保持相同夹角)而不是默认的大圆弧。 loxodromes的计算模式是在球面上,故 +l 不可与 -je 同时使用。

-C[section/]master|cpt|color\(_1\),color\(_2\)[,color\(_3\),…][+h[hinge]][+idz][+u|Uunit][+sfname]

基于 z 值确定颜色分量。通过指定主 CPT 名称,CPT 文件或用逗号分割的多个颜色, 以创建一个 CPT。如果不指定参数,则在现代模式下使用当前 CPT(如果可用)。 支持以下多种输入:

  1. 主 CPT 名称,例如 earth (详见 内置CPT ), 可使用 CPT 名称 master 或包括相对路径的 section/master 来指定(内置 CPT 不可添加 .cpt 扩展名)。

  2. 自定义 CPT 文件 cpt ,例如 my_colors.cpt

  3. 自动从多个颜色 color\(_1\),color\(_2\)[,color\(_3\),…] 中创建线性连续的 CPT,其中 z 值从 0 开始, 每添加一种颜色 z 值加 1。在这种情况下, color\(_i\) 可以是 r/g/b (e.g. 255/100/75), h-s-v (e.g. 180-0.8-1), c/m/y/k (e.g. 80/50/40/30),HTML十六进制 (e.g. #aabbcc) 或 颜色名称。逗号之间不能有空格。

支持以下选项:

  • +h - 对于有软铰链 (soft hinge) 的主 CPT,可指定 hinge 值启用铰链, 而对于有硬铰链 (harde hinge) 的 CPT,可以修改铰链位置 hinge ,但不能禁用。

  • +i - 指定 dz 使网格 z 值范围分层,默认使用精确范围。

  • +s - 将创建的 CPT 保存到文件 fname。当 CPT 是自动创建时这很有用, 但必须用于 -C 的末尾。

  • +u - 对于任何其他主 CPT,可以通过指定其原始单位 unit 将其 z 值单位转换为米。

  • +U - 与 +u 类似,但是将 z 值单位从米转换为指定单位 unit

注: 我们将在原始输出后新增四列,分别为 red、green 和 blue 的颜色分量 (均在 0-255 范围内)以及透明度(0-100%,0 表示不透明)。如果颜色表为灰度表, 则输出灰度(0-255)而非三原色。

-E

如果输入数据中每行记录最后包含有文本列,输出的插值结果将尝试保留 time 精确匹配的记录对应的文本列,其它 time 不匹配的则没有文本。默认忽略文本列。

-Fa|c|e|l|n|sp[+d1|2]

选择 1-D 插值方式:

  • a - Akima 样条(默认)

  • e - 阶梯曲线

  • c - 自然三次样条 (Natural cubic spline)

  • l - 线性插值

  • n - 不插值,取最近的数据点作为插值后的值

  • s - 平滑三次样条,指定拟合因子 p 以权衡样条拟合和曲率

用户也可以更改 GMT 默认的插值方式,见 GMT_INTERPOLANT 。 可以加上 +d1+d2 来计算样条的一阶导或二阶导。 注: 如果使用 en 的插值方法来计算导数,则结果恒为 0。

https://docs.generic-mapping-tools.org/latest/_images/GMT_splines.png

-F 选项允许您在多个插值方法中选择,包括一个近似方法(平滑样条)。 你也可以指定选项来计算导数。

-Ncol

选择独立变量 time 的列索引 col ,默认为 0(即首列)。

-T[min/max/]inc[+a][+i|n][+u] | [-Tfile|list]

定义要等距采样的 time 范围(从 minmax )和步长 inc (默认使用输入的 time 值)。若不使用 -A ,默认为 -Af 。 具体详见 生成一维数组

-V[level] (more …)

设置 verbose 等级 [w]

-Wcol

指定列索引值为 col 的列作为平滑三次样条的权重, 要求使用 -Fs

-bi[ncols][type][w][+l|b] (more …)

设置二进制输入数据的格式

-bo[ncols][type][w][+l|b] (more …)

设置二进制输出的数据格式

-d[i|o]nodata (more …)

将输入数据中等于 nodata 的记录替换为 NaN,或将输出数据中值为 NaN 的记录替换为 nodata

-e[~]“pattern” | -e[~]/regexp/[i] (more …)

筛选或剔除匹配指定模式的数据记录

-f[i|o]colinfo (more …)

指定输入或输出列的数据类型

-g[a]x|y|d|X|Y|D|[col]zgap[+n|p] (more …)

确定数据或线段的间断

-h[i|o][n][+c][+d][+msegheader][+rremark][+ttitle] (more …)

跳过或生成指定数目的头段记录

-icols[+l][+sscale][+ooffset][,][,t[word]] (more …)

设置输入数据列及简单变换(0表示第一列,t 表示文本列)

-je|f|g (more …)

设置球面距离的计算方式

-q[i|o][~]rows[+ccol][+a|f|s] (more …)

筛选输入或输出的行或数据范围

-s[cols][+a|+r] (more …)

设置 NaN 记录的处理方式

-wy|a|w|d|h|m|s|cperiod[/phase][+ccol] (more …)

将输入坐标转换为循环坐标

-^-

显示简短的帮助信息,包括模块简介和基本语法信息(Windows下只能使用 -

-++

显示帮助信息,包括模块简介、基本语法以及模块特有选项的说明

-? 或无参数

显示完整的帮助信息,包括模块简介、基本语法以及所有选项的说明

--PAR=value

临时修改GMT参数的值,可重复多次使用。参数列表见 配置参数

距离单位

GMT支持多种不同的距离单位,以及三种不同的球面距离计算方式。 详情见 单位-j 选项

ASCII 格式精度

ASCII 格式输出数据通过 gmt.conf 配置文件控制。控制经纬度格式的参数为 FORMAT_GEO_OUT ;控制绝对时间的的参数包括 FORMAT_DATE_OUTFORMAT_CLOCK_OUT ;普通浮点数通过参数 FORMAT_FLOAT_OUT 控制。上述格式控制可能会导致精度损失,这会在下游计算中导致一些问题。 如果用户需要保证数据精度,则应考虑将数据写为二进制文件,或者使用 FORMAT_FLOAT_OUT 指定更多的有效数字。

生成一维数组

下面将展示如何使用 gmtmath 生成一维数组(其中大部分操作也可通过 linux 中的 seq 命令方便地实现)

不使用任何子选项

以 0.1 为步长,生成 3.1 到 4.2 等等间隔序列

gmt math -o0 -T3.1/4.2/0.1 T =
3.1
3.2
...
4.2

+a 选项

该选项不对生成的数列进行运算操作,而是将该数列以列的形式追加到输出表数据,类似 linux 中的 paste 命令。

+b 选项

以 3 和 20 分别为起点和终点,创建一个 2 的整数幂的列表,将生成 的整数幂以 1 为步长取值 -T3/20/1+b

gmt math -o0 -T3/20/1+b T =
4
8
16

+l 选项

以 7 和 135 分别为起点和终点,先创建一个 10 的整数幂的列表,当 inc 为 1 时,输出该列表;当 inc 为 2 时,同时输出该列表中每个元素的 1,2,5 倍值(不包括超出原始数据范围的部分); 当 inc 为 3 时,同时输出 该列表中每个元素的 1,2,…,9 倍值(同样不包括超出原始数据范围的部分)。 -T7/135/2+l 将会生成如下数列

gmt math -o0 -T7/135/2+l T =
10
20
50
100

inc 为负整数时,将实现如下效果

gmt math -o0 -T1e-4/1e4/-2+l T =
0.0001
0.01
1
100
10000

+i 选项

该选项将以 1 作为默认步长,第三个数字做为每步长中的数字个数 length。假设需要在 1 分钟内每 24 秒生成一帧

gmt math -o0 -T0/60/24+i T =
0
0.0416666666667
0.0833333333333
0.125
0.166666666667
...
60

+n 选项

生成固定长度的数列。以 3.44 和 7.82 为 起点和终点,生成长度为 5 的等间隔序列

gmt math -o0 -T3.44/7.82/5+n T =
3.44
4.535
5.63
6.725
7.82

-T 后直接加文件或逗号分隔的数列

-T 后可以直接加文件,文件中即为要生成的列表;另外,可以直接使用逗号分隔, 将列表附加到 -T 选项后,如下为 Fibonacci 数列前 6 项

gmt math -o0 -T0,1,1,2,3,5 T =
0
1
1
2
3
5

: 如果数列只包含一个值,必须在其后加逗号以表明仍是一个数列

+u 选项

如果文件或者逗号分隔的数列中有重复数字或未排序,可以使用 +u 选项去重并排序。

+t 选项

生成绝对时间序列。在 inc 后分别添加 yodhms 表示时间步长的单位为年,月,日,时,分,秒。在其后附加 +t 选项, 可以进一步强调生成时间序列,也可以不加

gmt math -o0 -T2020-03-01T/2020-03-07T/1d T =
2020-03-01T00:00:00
2020-03-02T00:00:00
2020-03-03T00:00:00
2020-03-04T00:00:00
2020-03-05T00:00:00
2020-03-06T00:00:00
2020-03-07T00:00:00

生成距离序列

如果输入文件中包含两列以上的数据,可以使用前两列计算距离,并生成等距序列。 在 inc 后分别添加 dmsefMnu 表示距离步长的单位为度,分,秒,米,英尺,公里,英里,海里,英尺。如果 为笛卡尔坐标,使用 c 作为距离步长单位。

+e 选项

如果只给定 inc 而从数据中获取最大值和最小值,则 (max - min)/inc 可能 不是整数,GMT 讲会自动对 inc 进行一定的调整。如果不想调整 inc ,则可以 使用 +e 选项,GMT 会固定最小值,适当调整最大值。

注意

平滑样条 \(s(t)\) 通过设置拟合因子 \(p\) 在最小化拟合误差 (完全拟合所有点,对应 \(p\) 很大)和最小化曲率( \(p\) 接近 0)之间进行权衡。 具体而言,我们想要最小化以下泛函

\[F_p (s)= K (s) + p E (s), \quad p > 0,\]

其中拟合误差定义为

\[E (s)= \sum^n_{i=1} \left [ \frac{s(t_i) - y_i}{\sigma_i} \right ]^2\]

而曲率定义为样条的二阶导数的在区间上的定积分,

\[K (s) = \int ^b _a [s''(t) ]^2 dt.\]

可能需要反复试验来选择合适的 \(p\)

示例

: 下面是该模块的一些有效语法示例。使用远程文件(文件名以 @ 开头)的示例可以剪切并粘贴到您的终端中进行测试。其他需要输入文件的命令只是常见的使用类型的虚拟示例,但不能按编写的原样运行。

使用 Akima 样条以 1 km 为间隔重采样文件 profiles.tdgmb,文件格式为: time, distance, gravity, magnetics, bathymetry

gmt sample1d profiles.tdgmb -N1 -Fa -T1 > profiles_equi_d.tdgmb

使用三次样条插值,在 grav_pos.dg 指定的点位上采样文件 depths.txt

gmt sample1d depths.txt -Tgrav_pos.dg -Fc > new_depths.txt

将 0 到 6 之间的数据以 0.01 为间隔用三次样条重采样,不输出数据而是输出一阶偏导(即斜率):

gmt sample1d points.txt -T0/6/0.01 -Fc+d1 > slopes.txt

测线数据中包含经度、纬度和深度,将其采样为每 2 海里一个点:

gmt sample1d track.txt -T2n -AR > new_track.txt

同上,但确保包含了原始数据点:

gmt sample1d track.txt -T2n -Af > new_track.txt

以 5 km 为间隔,沿着恒向线采样

gmt sample1d track.txt -T5k -AR+l > new_track.txt

在文件 temperatures.txt 中采样 2000 年到 2018 年每月温度:

gmt sample1d temperatures.txt -T2000T/2018T/1o > monthly_temp.txt

在地形剖面上给定拟合因子使用平滑样条插值:

gmt sample1d @topo_crossection.txt -T300/500/0.1 -Fs0.001 > smooth.txt

相关模块

greenspline, filter1d