NetCDF

网络通用数据格式英語:NetCDF)是一种自描述、与机器无关、基于数组的科学数据格式,同时也是支持创建、访问和共享这一数据格式的函式库。该项目主页位于美国大气科学研究大学联盟(UCAR)的Unidata规划网站。它也是netCDF软件、标准开发、更新等的主要来源。NetCDF格式是一种开放标准。NetCDF的经典格式和64位偏移量格式是开放地理空间协会采用的国际标准[1]

Network Common Data Form
.nc
application/netcdf
application/x-netcdf
特征签名CDF\001
CDF\002
\211HDF\r\n\032\n
CDF\005
开发者美国大气科学研究大学联盟(UCAR)
最新版本
4.7.4
(2020年6月2日2020-06-02)
格式类型科学二进制数据
延伸自通用数据格式(CDF)
外部数据表示法(XDR)
层级数据格式(HDF)
网站

该项目开始于1989年,UCAR目前对其积极支持,在新发行版中改进性能、增加功能并修正缺陷,当前版本系列是netCDF-4,在编译时也可以选择只建造netCDF-3库[2]

历史

1985年美国国家航空航天局(NASA)的国家空间科学数据中心(NSSDC)设计并开发了通用数据格式(CDF),CDF最初是用FORTRAN写成并只能在VAX/VMS环境下获得[3]。Unidata在1987年8月成立了关于CDF的工作组,提议探索与NASA协作扩展CDF的FORTRAN接口,定义C接口,并允许用一个单一调用访问数据聚集,同时要维持与现存NASA接口兼容的可能性。在1988年早些时候,Unidata的Glenn Davis用C开发了原型netCDF包,它位于网络表示层XDR格式的上层[4]。这个原型证明了CDF接口的基于XDR的一个单一文件实现可以在可接受代价下完成,而结果的程序可以在UNIXVMS系统二者上实现。但这也说明了提供一个小的、可移植的、兼容于NASA CDF的有想要的通用性的FORTRAN接口是不实际的。NASA的CDF和Unidata的netCDF从此独立发展,但新近的CDF版本与netCDF共享了很多特征。[5]

1991年Unidata发布了netCDF版本2.0,1997年发布了版本3.3。2003年7月美国能源部阿贡国家实验室西北大学贡献了叫做并行-NetCDF(或称PnetCDF)的一个netCDF并行计算扩展[6]。2004年在NASA的资助下,Unidata与美国国家超级计算应用中心(NCSA)开始合作增进netCDF和HDF5的互操作性。2008年Unidata发布了版本4.0,允许使用HDF5数据文件格式。同时发布了版本3.6.3,它与版本4.0是同样的代码但关掉了netcdf-4特征,目前netCDF-3库仍然在世界各地被广泛使用。2010年Unidata发布了版本4.1.1,增加了对C和Fortran客户端通过OPeNDAP访问远程数据的特定子集的支持,并使用PnetCDF库支持在netCDF经典格式(CDF-1、CDF-2和2012年推出的CDF-5)上的并行I/O。[5]

格式描述

netCDF库支持netCDF文件的多种不同的二进制格式[7]

  • 在最初netCDF发行中使用的经典格式CDF-1,它仍是文件建立的缺省格式。
  • 在版本3.6.0中介入的64-bit偏移量格式CDF-2,它支持更大的变量和文件大小。
  • 在版本4.0中介入的netCDF-4/HDF5格式,它是带有一些限制的HDF5数据格式[8]
  • 在版本4.1中开始支持对HDF4 SD格式的只读访问[9]
  • 在版本4.4.0中介入了CDF-5格式,协同于并行-netcdf计划的规定[10]

所有格式都是“自描述的”。 这意味其中有一个头部,它描述文件余下部分的格局,特别是数组数据,连同以名称/值特性形式的任意文件元数据。这个格式是跨平台的,涉及的问题如字节序软件库中解决。数据以允许有效的构造子集的方式来存储。

起始于版本4.0,netCDF API允许使用HDF5数据格式[11]。NetCDF用户可以建立HDF5文件从而获得netCDF格式不具备的利益,比如更大的文件和多重无限制的维度。

完全后向兼容,可访问旧有netCDF文件并支持以前版本的C和Fortran API。

软件

netCDF常用于气候学气象学海洋学应用,如天气预报气候变化;也用于地理信息系统应用,是很多GIS应用的输入/输出格式;并用于通用科学数据交换。从它的站点引述如下[12]:netCDF(网络公用数据格式)是用于面向数组数据访问的一组接口,和针对C、Fortran、C++、Java和其他语言的一套自由发行的数据访问库。netCDF库支持用来表示科学数据的一种机器无关格式。接口、库和格式一起支持建立、访问和共享科学数据。

访问库

UCAR发布的软件库提供了对netCDF文件的读写访问,编码和解码所需的数组和元数据。核心库是用C编写的,并为 C、C++应用提供API,为Fortran应用提供两个API,一个给Fortran 77,一个给Fortran 90。Unidata还开发维护一个独立实现,使用100% Java写成,它扩展了核心数据模型并增加了额外的功能。还可获得其他语言的到基于C库的netCDF的接口,包括R(ncdf[13]、ncvar和RNetCDF[14]包)、Perl数据语言PythonRubyHaskell[15]MathematicaMATLABIDLOctave。API调用规定在不同语言间非常类似,尽管有着不可避免的不同语法。版本2的API调用与版本3的调用相当不同,但出于后向兼容而被版本3和版本4支持。应用编程者使用受支持语言,在正常情况下不需要关心文件结构自身,即使它是作为开放格式而获得的。

应用

现在已经写出了使用netCDF文件的范围广泛的应用程序。它们的范围从命令行实用程序到图形可视化包。下面列出其中一小部分,而更长的列表可见于UCAR网站列表[16]

  • NetCDF算子NCO页面存档备份,存于[17])套件是针对netCDF文件的常用Unix命令行实用工具集,它提供一套命令来操纵和分析netCDF文件,包括基本记录串接数组分片平均
  • ncview页面存档备份,存于[18]是netCDF格式文件的可视浏览器。这个程序是可视化在netCDF文件中的场的简单、快速、基于GUI的工具。
  • NCAR命令语言页面存档备份,存于[19](NCL)可用来分析和可视化netCDF中的数据(还支持其他格式)。
  • 网格分析和显示系统(GrADS)是交互式桌面工具,用来容易的访问、操纵和可视化地球科学数据。
  • Python语言访问netCDF文件可以用PyNIO模块(还支持其他格式)[20];还可以用Python模块netCDF4-python来读取[21];还可以用xarray模块变成类似pandasDataFrame[22]
  • R语言通过包来支持netCDF,包括ncdf4(也支持HDF5)[23],和RNetCDF(不支持HDF5)[24]
  • 地理数据抽象库GDAL页面存档备份,存于[25])提供对netCDF数据的读写访问支持[26]
  • Panoply页面存档备份,存于[27]是netCDF文件查看器,它关注地理网格数据的表示。它是用Java写成因而跨平台。
  • ECMWFMetview页面存档备份,存于[28]工作站和批处理系统可以处理NetCDF和GRIBBUFR
  • Ferret页面存档备份,存于[29]是交互式计算机可视化和分析环境,设计用来满足海洋学者和气象学者分析巨大而且复杂的网格数据。
  • HDFql页面存档备份,存于[30]使用户能在C、C++、Java、Python、C#、Fortran和R语言中通过高层语言(类似SQL)来管理netCDF-4/HDF5文件。

元数据约定

气候和预报(CF)约定是对地球科学数据的元数据约定,意图用于促进处理和共享通过NetCDF应用编程接口(API)建立的文件。CF约定于2003年建立,普遍化并扩展了早期的协作海洋/大气研究数据服务(COARDS页面存档备份,存于[31])约定和对气候数据的Gregory/Drach/Tett(GDT)约定[32]。CF约定定义了与数据包含在同一个文件中的元数据,从而使得文件“自我描述”,提供对在每个变量中的数据表示的是什么的确切描述,和数据的空间的和时间的属性的确切描述,包括关于网格的信息,比如网格单元边界和单元平均方法。这使得能够使用来自不同来源的数据,确定哪些数据是可比较的,并允许建造有着强力的提取、重新插值和显示能力的应用。Unidata 在2007年至2011年开发了LibCF库页面存档备份,存于[33]

并行-NetCDF

并行-NetCDF扩展建造在MPI-IO之上,它是对MPII/O扩展。使用高层netCDF数据结构,并行-NetCDF库可以进行优化而在多处理器间高效分配文件读和写应用。并行-NetCDF包只可以读/写经典和64-bit偏移量格式。并行-NetCDF不能读或写在netCDF-4.0中可获得的基于HDF5的格式。并行-NetCDF包使用不同但类似的Fortran和C的API。

在Unidata netCDF库中自从版本4.0已经支持对HDF5数据文件的并行I/O。Unidata NetCDF C库自从版本4.1.1使用并行-NetCDF库支持对经典和64-bit偏移量文件的并行 I/O,但使用NetCDF API。

与其他格式库的互操作性

netCDF C库,和基于它的库:Fortran 77和Fortran 90、C++和所有第三方库,自从版本4.1.1开始可以读一些其他数据格式的数据。HDF5格式的数据可以读取,但有一些限制[34]。使用HDF4科学数据(SD)API建立的HDF4格式的数据,可以用netCDF C库读取。

NetCDF-Java通用数据模型

NetCDF-Java库目前已经能够读取很多文件格式和远程访问协议,并且正在开发对一些其他的格式的支持。因为这些都是通过NetCDF API透明的进行访问,NetCDF-Java库被称为实现了科学数据集的“通用数据模型”。

参见

  • 通用数据格式 (CDF)
  • CGNS (CFD General Notation System)
  • EAS3 (Ein-Ausgabe-System)
  • FITS (Flexible Image Transport System)
  • GRIB (GRIdded Binary)
  • 层级数据格式(HDF)
  • OPeNDAP 客户-服务器协议
  • Tecplot 二进制文件
  • XMDF (eXtensible Model Data Format)

引用

  1. . Opengeospatial.org. [2013-11-27].
  2. Building netCDF with Classic Library Only 页面存档备份,存于.
  3. . [2019-06-08]. (原始内容存档于2018-06-19).
  4. File Structure and Performance: The Extended XDR Layer 页面存档备份,存于.
  5. . [2019-06-06].
  6. . Mcs.anl.gov. 2013-11-17 [2013-11-27]. (原始内容存档于2008-12-01).
  7. The netCDF File Format 页面存档备份,存于.
  8. File Structure and Performance: Parts of a NetCDF-4 HDF5 File 页面存档备份,存于.
  9. Appendix B. File Format Specifications: HDF4 SD Format 页面存档备份,存于.
  10. CDF-5 file format specification 页面存档备份,存于.
  11. . Unidata.ucar.edu. [2013-11-27]. (原始内容存档于2015-06-17).
  12. . Unidata Program Center. [2012-11-26]. (原始内容存档于2013-03-15).
  13. . Cirrus.ucsd.edu. 2013-08-06 [2013-11-27]. (原始内容存档于2013-12-03).
  14. . Cran.r-project.org. 2012-07-19 [2013-11-27]. (原始内容存档于2013-12-02).
  15. . hackage.haskell.org. 2014-07-10 [2014-07-10]. (原始内容存档于2014-07-09).
  16. russ. . Unidata.ucar.edu. 1990-01-01 [2013-11-27]. (原始内容存档于2013-12-02).
  17. . [2019-06-16]. (原始内容存档于2019-06-16).
  18. . [2019-06-05]. (原始内容存档于2014-02-12).
  19. . [2020-09-26]. (原始内容存档于2004-05-07).
  20. . Pyngl.ucar.edu. 2011-07-28 [2013-11-27]. (原始内容存档于2013-11-25).
  21. . [2017-12-04]. (原始内容存档于2017-11-29).
  22. . [2016-09-07]. (原始内容存档于2016-09-01).
  23. David Pierce (2014). ncdf4: Interface to Unidata netCDF (version ) format data files. R package version 1.13. https://cran.r-project.org/package=ncdf4 页面存档备份,存于
  24. Pavel Michna and with contributions from Milton Woods (2015). RNetCDF: Interface to NetCDF Datasets. R package version 1.7-3. https://cran.r-project.org/package=RNetCDF
  25. . [2019-06-21]. (原始内容存档于2019-06-17).
  26. . Gdal.org. [2013-11-27]. (原始内容存档于2013-06-06).
  27. . [2019-06-05]. (原始内容存档于2014-06-20).
  28. . [2019-06-21]. (原始内容存档于2019-06-01).
  29. . [2019-06-18]. (原始内容存档于2019-06-18).
  30. . [2020-09-26]. (原始内容存档于2019-09-16).
  31. . [2019-06-18]. (原始内容存档于2019-06-18).
  32. NetCDF Conventions 页面存档备份,存于.
  33. . [2019-06-16]. (原始内容存档于2015-02-28).
  34. File Structure and Performance: Interoperability with HDF5 页面存档备份,存于.

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.