<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 15 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"Malgun Gothic";
        panose-1:2 11 5 3 2 0 0 2 0 4;}
@font-face
        {font-family:"\@Malgun Gothic";
        panose-1:2 11 5 3 2 0 0 2 0 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.m-5140493970415636338hoenzb
        {mso-style-name:m_-5140493970415636338hoenzb;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-GB link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='mso-fareast-language:EN-US'>Murata-san<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'>I think you meant _[0-9a-<span style='color:red'>f</span>A-F]{4}_<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'>I have tested this by creating a simple spreadsheet in LibreOffice. It seems that LibreOffice does not support this feature. See attached. Here is the string table:<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'><sst xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" count="4" uniqueCount="4"><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    <si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>        <t xml:space="preserve">_xaaaa_</t><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    </si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    <si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>        <t xml:space="preserve">_xaaaa</t><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    </si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    <si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>        <t xml:space="preserve">_xgggg_</t><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    </si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    <si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>        <t xml:space="preserve">_xaaa_</t><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'>    </si><o:p></o:p></span></p><p class=MsoNormal><span style='font-family:"Courier New";mso-fareast-language:EN-US'></sst><o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'>If I open the document in LibreOffice, the first string is displayed as ‘_xaaaa_’. If I open the same document in Excel, the first string is converted to the Unicode character #xaaaa.<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'>Kind regards,<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'>Francis<o:p></o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><span style='mso-fareast-language:EN-US'><o:p> </o:p></span></p><p class=MsoNormal><b><span lang=EN-US>From:</span></b><span lang=EN-US> eb2mmrt@gmail.com [mailto:eb2mmrt@gmail.com] <b>On Behalf Of </b>MURATA Makoto<br><b>Sent:</b> 10 November 2017 02:00<br><b>To:</b> SC 34 WG4 <e-SC34-WG4@ecma-international.org><br><b>Subject:</b> Re: DR-16-0022: Shared ML: Escaping strings in ST_Xstring<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal>Francis,<o:p></o:p></p><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>Thanks for your comments.  I now understand.<o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>I did some experiments.  Excel appears to escape an underscore <o:p></o:p></p></div><div><p class=MsoNormal>only when it is the first character of a string matching  _[0-9a-zA-F]{4}_<o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>Regards,<o:p></o:p></p></div><div><p class=MsoNormal>Makoto<o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>SW_x005F_x3850_CPU</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x005F_x3850_CPU</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xzxcv</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xzxcv_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xzxcwev_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xFFFFFF_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x2000B_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x3000</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x005F_x3000_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x005F_xFFFF_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xFF_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x0F_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xF_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xG_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xGG_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xGGG_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xGGGG_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x000G_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_xFFF_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x005F_xffff_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div><div><p class=MsoNormal>    <si><o:p></o:p></p></div><div><p class=MsoNormal>        <t>_x005F_xf3f2_</t><o:p></o:p></p></div><div><p class=MsoNormal>        <phoneticPr fontId="1"/><o:p></o:p></p></div><div><p class=MsoNormal>    </si><o:p></o:p></p></div></div></div></div><div><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal>2017-11-09 23:50 GMT+09:00 Francis Cave <<a href="mailto:francis@franciscave.com" target="_blank">francis@franciscave.com</a>>:<o:p></o:p></p><blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm'><div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Murata-san<o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>I think that this DR is asking how to serialise the literal string “SW_x3850_CPU”, not “SW<span style='font-family:"Malgun Gothic",sans-serif'>㡐</span><span style='font-family:"Malgun Gothic",sans-serif'>CPU</span>”. If “_xHHHH_” is interpreted as the Unicode character #xHHHH, any literal string in the form “_xHHHH_” has to have the initial “_” escaped, which is what Charlie is saying that Excel does. But does this mean that “_” is always escaped by Excel, or only escaped in certain contexts, such as if followed by “x”? Does this need to be tested? <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Kind regards,<o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Francis<o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><b><span lang=EN-US>From:</span></b><span lang=EN-US> <a href="mailto:eb2mmrt@gmail.com" target="_blank">eb2mmrt@gmail.com</a> [mailto:<a href="mailto:eb2mmrt@gmail.com" target="_blank">eb2mmrt@gmail.com</a>] <b>On Behalf Of </b>MURATA Makoto<br><b>Sent:</b> 09 November 2017 00:55<br><b>To:</b> SC 34 WG4 <<a href="mailto:e-SC34-WG4@ecma-international.org" target="_blank">e-SC34-WG4@ecma-international.org</a>><br><b>Subject:</b> Re: DR-16-0022: Shared ML: Escaping strings in ST_Xstring</span><o:p></o:p></p><div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>>§22.9.2.19, “ST_Xstring (Escaped String)” says:<br>><br>>For all characters that cannot be represented in XML as defined by the <o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>>XML 1.0 specification, the characters are escaped using the Unicode <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>>numerical character representation escape character format _xHHHH_, where H<br>>represents a hexadecimal character in the character's value. <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>>[Example: The Unicode character 8 is not permitted<br>> in an XML 1.0 document, so it must be escaped as _x0008_. end example]<br><br>> But it's not clear from this if all such combinations should be escaped?<br>> or just those in the range [001-031]. Excel itself handles such sequences by<o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>>  escaping the first underscore but unfortunately other consumers such as <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>> OpenOffice do not remove the escaping so I think this needs clarifying.<o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>W3C XML clearly defines which character is legal.  We should <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>mention <a name="m_-5140493970415636338_wf-Legalchar" id="m_-5140493970415636338gmail-wf-Legalchar"><b><span style='font-size:13.5pt;font-family:"Arial",sans-serif;color:black'>Well-formedness constraint: Legal Character.</span></b></a><o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><a href="https://www.w3.org/TR/2006/REC-xml-20060816/#wf-Legalchar" target="_blank">https://www.w3.org/TR/2006/REC-xml-20060816/#wf-Legalchar</a><o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Or, does this DR ask how we can represent a literal such as  "_x2345"?<o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Regards,<o:p></o:p></p></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>Makoto<o:p></o:p></p></div></div><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>2016-12-07 5:20 GMT+09:00 Rex Jaeschke <<a href="mailto:rex@rexjaeschke.com" target="_blank">rex@rexjaeschke.com</a>>:<o:p></o:p></p><blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0cm;margin-bottom:5.0pt'><p class=MsoNormal style='mso-margin-top-alt:auto;margin-bottom:12.0pt'>Here's a new DR from Charlie.<br><span style='color:#888888'><br><span class=m-5140493970415636338hoenzb>Rex</span></span><o:p></o:p></p></blockquote></div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><br><br clear=all><o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'> <o:p></o:p></p></div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'>-- <o:p></o:p></p><div><p class=MsoNormal style='mso-margin-top-alt:auto;mso-margin-bottom-alt:auto'><br>Praying for the victims of the Japan Tohoku earthquake<br><br>Makoto<o:p></o:p></p></div></div></div></div></div></div></blockquote></div><p class=MsoNormal><br><br clear=all><o:p></o:p></p><div><p class=MsoNormal><o:p> </o:p></p></div><p class=MsoNormal>-- <o:p></o:p></p><div><p class=MsoNormal><br>Praying for the victims of the Japan Tohoku earthquake<br><br>Makoto<o:p></o:p></p></div></div></div></body></html>