LaTex 中圆圈序号及一些特殊字符的输入
阅读原文时间:2022年01月19日阅读:1

众所周知,LATEX 提供了 \textcircled 命令用以给字符加圈,但效果却不怎么好:

实际上,加圈并不是一个平凡的变换,它会涉及到圈内字符形状的微调,而这是几乎无法在 TEX 宏层面解决的。因此,要得到比较好的效果,最好能使用预先设计的字符形(glyph)。


pifont 宏包提供了一系列杂锦符号(dingbats),其中就有带圈数字。pifont 属于 psnfss 宏集,它封装了一系列 PostScript 字体,包含著名的 Helvetica、Times、Courier 等。pifont 使用的是 Zapf Dingbats 字体。

使用 \ding{<number>} 可以很方便地使用带圈数字(共有四种),当然也有其他符号。具体数字可参见下图:

在主流的 TEX 引擎下,pifont 宏包都可以使用。


数字 0–50 的带圈版本都分配了对应的 Unicode 码位,因而在现代 TEX 引擎(X⁠E⁠TEX 和 Lua­TEX,若无特殊说明以下仅讨论这两者)中,配合合适的字体,理论上可以直接输入这些符号。具体见下表:[1]

24EA

2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246A

246B

246C

246D

246E

246F

2470

2471

2472

2473

3251

3252

3253

3254

3255

3256

3257

3258

3259

325A

325B

325C

325D

325E

325F

32B1

32B2

32B3

32B4

32B5

32B6

32B7

32B8

32B9

32BA

32BB

32BC

32BD

32BE

32BF

Zapf Dingbats 中的其他几种样式也分配有码位:

  • 反白(negative circled digits)

    24FF

    2776

    2777

    2778

    2779

    277A

    277B

    277C

    277D

    277E

    277F

    24EB

    24EC

    24ED

    24EE

    24EF

    24F0

    24F1

    24F2

    24F3

    24F4

  • 无衬线(circled sans-serif digits)

    1F10B

    2780

    2781

    2782

    2783

    2784

    2785

    2786

    2787

    2788

    2789

  • 无衬线反白(negative circled sans-serif digits)

    1F10C

    278A

    278B

    278C

    278D

    278E

    278F

    2790

    2791

    2792

    2793

此外,还额外增加了一些样式:

  • 双线(double circled digits)

    24F5

    24F6

    24F7

    24F8

    24F9

    24FA

    24FB

    24FC

    24FD

    24FE

  • 加框(circled numbers on black square)

    3248

    3249

    324A

    324B

    324C

    324D

    324E

    324F

  • 带圆括号(parenthesized digits)

    2474

    2475

    2476

    2477

    2478

    2479

    247A

    247B

    247C

    247D

    247E

    247F

    2480

    2481

    2482

    2483

    2484

    2485

    2486

    2487

  • 带点(digits with full stop)

    1F100

    2488

    2489

    248A

    248B

    248C

    248D

    248E

    248F

    2490

    2491

    2492

    2493

    2494

    2495

    2496

    2497

    2498

    2499

    249A

    249B

  • 带逗号(digits with comma)

    1F101

    1F102

    1F103

    1F104

    1F105

    1F106

    1F107

    1F108

    1F109

    1F10A

  • 这些姑且也算上吧:

    3220

    3221

    3222

    3223

    3224

    3225

    3226

    3227

    3228

    3229

    3280

    3281

    3282

    3283

    3284

    3285

    3286

    3287

    3288

    3289

    1F229

    1F214

    1F22A

    1F242

    1F241

这些符号分散在以下几个 Unicode 区块(block)中:

  • Enclosed Alphanumerics (U+2460–U+24FF)

    • 带圈 0–20(以及 a–z、A–Z)
    • 反白 0、11–20
    • 双线 1–10
    • 带圆括号 1–20
    • 带点 1–20
  • Dingbats (U+2700–U+27BF)

    • 反白 1–10
    • 无衬线 1–10
    • 无衬线反白 1–10
  • Enclosed CJK Letters and Months (U+3200–U+32FF)

    • 带圈 21–50
    • 加框 10–80(仅限整十)
    • 带圈
    • 带圆括号
  • Enclosed Alphanumeric Supplement (U+1F100–U+1F1FF)

    • 带逗号 0–9
    • 无衬线、无衬线反白以及带点的 0
  • Enclosed Ideographic Supplement (U+1F200–U+1F2FF)

    • 带方框
    • 带六角括号

直接输入,或者利用码位,都能在 LATEX 中使用以上这些带圈数字(注意不同方法对大小写的要求有差异):

\documentclass{article}
\usepackage{fontspec}
\setmainfont{Source Han Serif SC}

\begin{document}
① ② ③ ④ ⑤
\symbol{"2776} \symbol{"2777} \symbol{"2778} \symbol{"2779} \symbol{"277A}
\char"3248\    \char"3249\    \char"324A\    \char"324B\    \char"324C\
^^^^3280       ^^^^3281       ^^^^3282       ^^^^3283       ^^^^3284
^^^^^1f229     ^^^^^1f214     ^^^^^1f22a
\end{document}

使用 X⁠ELATEX 或 Lua­LATEX 编译,效果如下:


在实际使用中,无论是依靠码位,还是借由输入法直接录入这些特殊字符,都不是很方便。在 xunicode-addon 宏包(从属于 xeCJK)中,\textcircled 等一系列命令被重新定义,从而能够显示 Unicode 所分配的带圈数字(和字母等)。举例如下:

\documentclass{article}
\usepackage{fontspec,xunicode-addon}
\setmainfont{Source Han Serif SC}

\begin{document}
\textcircled{1}
\textcircled{25}
\textcircled{a}
\textcircled{Z}
\end{document}

利用 LATEX3 语法也可以迅速写出如下循环而不伤身体:

\ExplSyntaxOn
\cs_set:Npn \TESTi
  {
    \int_step_inline:nnn {  0 } { 25 } { \textcircled{##1} ~ } \par
    \int_step_inline:nnn { 26 } { 50 } { \textcircled{##1} ~ } \par
  }
\cs_set:Npn \TESTii
  { \tl_map_inline:nn { abcdefghijklmnopqrstuvwxyz } { \textcircled{##1} ~ } \par }
\cs_set:Npn \TESTiii
  { \tl_map_inline:nn { ABCDEFGHIJKLMNOPQRSTUVWXYZ } { \textcircled{##1} ~ } \par }
\ExplSyntaxOff

\TESTi
\TESTii
\TESTiii

当然,其他样式的带圈数字并没有提供快捷的输入方式。


以上的案例都是在标准文档类 article 中搭配 fontspec 宏包完成的。如果切换成 ctex 宏集,则需要额外做一些调整。

对于中文文档,我们通常需要为中西文(「西文」主要指 Latin script)分别设置字体。上面已经提到过,带圈数字分散在了几个 Unicode 区块中。xeCJK 将其中的 Enclosed CJK Letters and Months 和 Enclosed Ideographic Supplement 设置为了 CJK 字符类,使用中文字体;其余则为 Default 字符类,使用西文字体。

Lua­TEX 下的情况类似,但稍显复杂。首先是 luatexja 作出了 ALchar 和 JAchar 的划分,大致相当于西文和日文(AL=ALphabetic,JA=JApanese);同时又预定义了一些字符范围。默认设置中,上文所列的所有带圈数字均会使用日文字体。其后,ctex 宏集为了适应中文排版的需求又做了一些修改。结果是,Enclosed Alphanumerics 被设置为了 ALchar,即使用西文字体。

总而言之,在 ctex 宏集的默认配置下:

Unicode 区块

X⁠ELATEX

Lua­LATEX

Enclosed Alphanumerics

西文

西文

Dingbats

西文

西文

Enclosed CJK Letters and Months

中文

中文

Enclosed Alphanumeric Supplement

西文

西文

Enclosed Ideographic Supplement

中文

西文

在 X⁠ELATEX 下,可以做如下修改:

% 使用中文字体
\xeCJKDeclareCharClass{CJK}{%
  "24EA,        % ⓪
  "2460->"2473, % ①–⑳
  "3251->"32BF, % ㉑–㊿
  "24FF,        % ⓿
  "2776->"277F, % ❶–❿
  "24EB->"24F4  % ⓫–⓴
}
\setCJKmainfont{Source Han Serif SC}

% 或使用西文字体
% \xeCJKDeclareCharClass{Default}{%
%   "24EA, "2460->"2473, "3251->"32BF,
%   "24FF, "2776->"277F, "24EB->"24F4}
% \setmainfont{Garamond-Math.otf}

在 Lua­LATEX 下,也完全类似:

% 使用中文字体
\ltjdefcharrange{6}{%
  "24EA, "2460-"2473, "3251-"32BF,
  "24FF, "2776-"277F, "24EB-"24F4}
\setCJKmainfont{Source Han Serif SC}

% 或使用西文字体
% \ltjdefcharrange{3}{%
%   "24EA, "2460-"2473, "3251-"32BF,
%   "24FF, "2776-"277F, "24EB-"24F4}
% \setmainfont{Garamond-Math.otf}

这里的 63 原先分别对应日文字符和西文标点、符号。还需注意范围的写法与 xeCJK 中不同。

配合 xunicode-addon 宏包,在 ctex 宏集中也同样可以使用 \textcircled 命令输入预定义的带圈数字。但需注意,\textcircled 会预先检查字符是否存在,且仅在西文字体中进行。所以如需使用中文字体进行显示,就要「指鹿为马」:[2]

% XeLaTeX 下需要把全体带圈数字都设置成 Default 类
% LuaLaTeX 下无须额外设置
\xeCJKDeclareCharClass{Default}{"24EA, "2460->"2473, "3251->"32BF}

% 将中文字体声明为(西文)字体族
\newfontfamily\EnclosedNumbers{Source Han Serif SC}

% 放置钩子,只让带圈字符才需更换字体
\AtBeginUTFCommand[\textcircled]{\begingroup\EnclosedNumbers}
\AtEndUTFCommand[\textcircled]{\endgroup}

对于字体中没有的带圈数字,\textcircled 也能够自动生成(由圆圈和相应的数字拼合)。选择合适的字体之后,便可做一些比较暴力的尝试:

即使是三位数,效果也尚能接受。

在 OpenType 中,有一项名为 nalt(Alternate Annotation Forms)的 GSUB 特性,它的作用是把特定的字符形替换成符号标注形式(notational forms)。不少日文字体都包含这一特性,我们可以利用 fontspec 宏包提供的相关选项调用。举例如下:

\documentclass{article}
\usepackage{fontspec}
\setmainfont{ipaexm.ttf}  % IPAex 明朝,TeX Live 自带

\begin{document}
{\addfontfeature{Annotation=0}123456789}
{\addfontfeature{Annotation=1}123456789}
{\addfontfeature{Annotation=2}123456789}
\end{document}

需要注意的是,Annotation=X 中的某个 X 具体对应何种样式,这是由字体设计者决定的。此外,在一些字体中,部分假名、汉字也有类似的标注形式,可以用相同方法使用:

\documentclass{ctexart}
\setCJKmainfont{Hiragino Mincho Pro W3}

\begin{document}
{\addCJKfontfeature{Annotation=0}あア}
{\addCJKfontfeature{Annotation=1}かカ}
{\addCJKfontfeature{Annotation=2}さサ}
{\addCJKfontfeature{Annotation=3}たタ}
{\addCJKfontfeature{Annotation=4}なナ}
{\addCJKfontfeature{Annotation=5}はハ}
{\addCJKfontfeature{Annotation=6}まマ}
\end{document}

这里我们用 \addCJKfontfeature 代替了 \addfontfeature。此处作为演示的字体是 macOS 自带的ヒラギノ明朝,在 Windows/Linux 上可换用其他字体。

Adobe-Japan1-7 字符集定义了更多的带圈数字,很多样式都支持 0–100 的数字范围。但由于 Unicode 没有为它们分配码位,我们必须用 CID(Character IDentifier)来指定。[3]

由于 CID 到具体字符的映照比较复杂,因而这里我们提供了一个宏包 textcircle-cid,用来通过 CID 调用带圈数字。textcircle-cid 宏包提供了下面一组命令:

  • \CIDtextcircled
  • \CIDtextblackcircled
  • \CIDtextboxed
  • \CIDtextblackboxed
  • \CIDtextrboxed
  • \CIDtextblackrboxed

支持的数字范围是 0–100 和 00–09。X⁠E⁠TEX、Lua­TEX 和 up­TEX 这三种 Unicode 引擎均可使用,但需要配合其他宏包及命令以实现正确的字体调用:

  • X⁠ELATEX 下需要通过 \setmainfont 等命令设置字体

  • Lua­LATEX 下需要通过 \setmainjfont 等命令设置(日文)字体

  • up­LATEX 下需要调用 pxchfon 宏包,并且使用 \setminchofont 等命令设置字体,具体可以参考以下示例:

    % test-uptex.tex
    \documentclass{ujarticle}
    \usepackage{pxchfon,textcircle-cid}
    \setminchofont{KozMinPr6N-Regular.otf}
    \setgothicfont{KozGoPr6N-Regular.otf}
    
    \def\TEST{%
      \CIDtextcircled{0}
      \CIDtextblackcircled{1}
      \CIDtextboxed{00}
      \CIDtextblackboxed{10}
      \CIDtextrboxed{50}
      \CIDtextblackrboxed{100}}
    
    \begin{document}
    \textmc{\TEST} \par
    \textgt{\TEST}
    \end{document}

    注意 up­TEX 不直接生成 PDF,因此编译时可采取如下方式:

    uplatex test-uptex && dvipdfmx test-uptex

    在上面的示例中,我们使用的字体是 Adobe 的小塚明朝和小塚ゴシック。事实上,只有遵从 Adobe-Japan1 的字体,才能利用 CID 正确地调用相应的字符。

上文我们多次提及,带圈数字的具体使用与字体密切相关。下面我们整理了 TEX Live 自带的、可使用带圈数字的字体,以及对应的数字范围:

字体

带圈

反白

无衬线

无衬线反白

Baekmuk Batang/Dotum/Gulim/Headline

1–15

Carlito

0–20

0–20

DejaVuSans

1–10

1–10

1–10

1–10

FreeMono, FreeSans

1–10

FreeSerif

1–10

1–10

1–10

1–10

Garamond Math

0–50

0–20

IPAGothic, IPAMincho

1–50

1–20

Junicode

0–20

0–20

Lato

0–20

0–20

Libertinus Serif/Sans/Math, Linux Libertine, Linux Biolinum

0–20

0–20

Libertinus Keyboard, Linux Biolinum Keyboard

1–10

STIX, STIX Math

0–9

1–10

1–10

STIX Two Math

0–20

0–20

1–10

1–10

UnBatang, UnDinaru, UnDotum, UnGraphic, UnGungseo, UnJamoBatang, UnJamoDotum, UnJamoNovel, UnJamoSora, UnPen, UnPenheulim, UnPilgi, UnPilgia, UnShinmun, UnVada, UnYetgul

0–20

XITS, XITS Math

0–9

1–10

1–10

文鼎PL简报宋、文鼎PL简中楷

1–10

以下是其他一些常见中、日文字体,其中很多是操作系统自带的:

字体

带圈

反白

无衬线

无衬线反白

思源宋体、思源黑体

0–50

0–20

0–10

0–10

微软雅黑、微软正黑

1–10

苹方

0–50

0–20

0–10

1–10

方正书宋、方正黑体、方正楷体、方正仿宋、等线

1–10

宋体、黑体、楷体、仿宋(中易)

1–10

更纱黑体 (Sarasa Gothic)

0–50

0–20

0–10

0–10

小塚明朝 (Kozuka Mincho)、小塚ゴシック (Kozuka Gothic)

0–100

0–100

游明朝 (Yu Mincho)、游ゴシック (Yu Gothic)

0–100

0–100

メイリオ (Meiryo)

0–50

1–20

0–10

1–10

这里我们用了 Python 脚本 check-circled-number.py 来读取字体信息,它还依赖 FontForge。注意由于字体版本不同,不保证表中所列结果与实际情况完全一致。

  1. ^在本页面的 CSS 中,带圈数字将优先使用思源宋体(Source Han Serif)显示,但具体结果仍然取决于字体的安装情况以及浏览器的渲染方式。
  2. ^感谢 @qinglee 的指导!见 CTeX-org/ctex-kit #399
  3. ^感谢 @clerkma 的指导!见 CTeX-org/forum #20