fbpx
Wikipedia

Windows-1252

Windows-1252 o CP-1252 es una codificación de caracteres del alfabeto latino, usada por defecto cuando unicode no se usa en los componentes oficiales de Microsoft Windows en inglés y en algunos lenguajes occidentales. Es una versión en la que el código de páginas de Windows está en los paquetes de LaTeX, el cual se refiere como ansinew.

Windows-1252. Los puntos azules significan códigos sin uso.

Detalles

Esta codificación es un superconjunto de ISO 8859-1, pero difiere de la ISO-8859-1 de IANA por el uso de caracteres no imprimibles en vez de caracteres de control en el rango 0x80 a 0x9F. Es conocido en Windows como el código de caracteres número 1252, y con el nombre de "windows-1252", aprobado por la IANA. Este código de caracteres también incluye todos los caracteres imprimibles de ISO 8859-15 (algunos mapeados a diferentes posiciones).

Es muy común confundir la codificación de caracteres Windows-1252 con la de ISO-8859-1. El resultado habitual era que todas las comillas y apóstrofos (producidos por las "comillas inteligentes" en software Microsoft) eran reemplazadas por signos de interrogación o por cajas en sistemas operativos no-Windows, haciendo que el texto resultara difícil de leer. La mayoría de los navegadores modernos y clientes de correo electrónico, tratan la codificación de caracteres de MIME ISO-8859-1 como Windows-1252 con el fin de paliar esta confusión. Este es uno de los estándares en las especificaciones de HTML 5, que requieren una interpretación de ISO-8859-1 en Windows-1252.[1]

Históricamente, el término "ANSI code page" (ACP) se usa en Windows para referirse a varias páginas de códigos consideradas como nativas. La intención era que la mayoría de estas fueran estándares ANSI como lo es el ISO-8859-1. Incluso, Windows-1252 fue la primera y de lejos la más popular página de códigos de los idiomas que soporta Microsoft Windows, y sin embargo jamás ha sido un estándar ANSI. Microsoft establece que "El término ANSI usado para indicar a los códigos de página Windows, es una referencia histórica, pero actualmente es un término equivocado que aún continua persistente en la comunidad de Windows."[2]

Diseño de la codificación de caracteres

La siguiente tabla muestra la codificación Windows-1252, con las diferencias con la codificación ISO-8859-1 marcadas con bordes gruesos y asteriscos(*). Cada carácter se muestra con su equivalente en Unicode y con su código en decimal.


Microsoft cita el mapeo de los caracteres con Unicode con el "mejor ajuste",[3]​ el cual incluye los cinco caracteres no mapeados, así como los caracteres mapeados al 1252 que están obsoletos.

Windows-1252 (CP1252)
—0 —1 —2 —3 —4 —5 —6 —7 —8 —9 —A —B —C —D —E —F
0- NUL
0000
0
SOH
0001
1
STX
0002
2
ETX
0003
3
EOT
0004
4
ENQ
0005
5
ACK
0006
6
BEL
0007
7
BS
0008
8
HT
0009
9
LF
000A
10
VT
000B
11
FF
000C
12
CR
000D
13
SO
000E
14
SI
000F
15
1- DLE
0010
16
DC1
0011
17
DC2
0012
18
DC3
0013
19
DC4
0014
20
NAK
0015
21
SYN
0016
22
ETB
0017
23
CAN
0018
24
EM
0019
25
SUB
001A
26
ESC
001B
27
FS
001C
28
GS
001D
29
RS
001E
30
US
001F
31
2- SP
0020
32
!
0021
33
"
0022
34
#
0023
35
$
0024
36
%
0025
37
&
0026
38
'
0027
39
(
0028
40
)
0029
41
*
002A
42
+
002B
43
,
002C
44
-
002D
45
.
002E
46
/
002F
47
3- 0
0030
48
1
0031
49
2
0032
50
3
0033
51
4
0034
52
5
0035
53
6
0036
54
7
0037
55
8
0038
56
9
0039
57
:
003A
58
;
003B
59
<
003C
60
=
003D
61
>
003E
62
?
003F
63
4- @
0040
64
A
0041
65
B
0042
66
C
0043
67
D
0044
68
E
0045
69
F
0046
70
G
0047
71
H
0048
72
I
0049
73
J
004A
74
K
004B
75
L
004C
76
M
004D
77
N
004E
78
O
004F
79
5- P
0050
80
Q
0051
81
R
0052
82
S
0053
83
T
0054
84
U
0055
85
V
0056
86
W
0057
87
X
0058
88
Y
0059
89
Z
005A
90
[
005B
91
\
005C
92
]
005D
93
^
005E
94
_
005F
95
6- `
0060
96
a
0061
97
b
0062
98
c
0063
99
d
0064
100
e
0065
101
f
0066
102
g
0067
103
h
0068
104
i
0069
105
j
006A
106
k
006B
107
l
006C
108
m
006D
109
n
006E
110
o
006F
111
7- p
0070
112
q
0071
113
r
0072
114
s
0073
115
t
0074
116
u
0075
117
v
0076
118
w
0077
119
x
0078
120
y
0079
121
z
007A
122
{
007B
123
|
007C
124
}
007D
125
~
007E
126
DEL
007F
127
8-
20AC
128*
 
201A
130*
ƒ
0192
131*

201E
132*

2026
133*

2020
134*

2021
135*
ˆ
02C6
136*

2030
137*
Š
0160
138*

2039
139*
Œ
0152
140*
  Ž
017D
142*
 
9-  
2018
145*

2019
146*

201C
147*

201D
148*

2022
149*

2013
150*

2014
151*
˜
02DC
152*

2122
153*
š
0161
154*

203A
155*
œ
0153
156*
  ž
017E
158*
Ÿ
0178
159*
A- NBSP
00A0
160
¡
00A1
161
¢
00A2
162
£
00A3
163
¤
00A4
164
¥
00A5
165
¦
00A6
166
§
00A7
167
¨
00A8
168
©
00A9
169
ª
00AA
170
«
00AB
171
¬
00AC
172
SHY
00AD
173
®
00AE
174
¯
00AF
175
B- °
00B0
176
±
00B1
177
²
00B2
178
³
00B3
179
´
00B4
180
µ
00B5
181

00B6
182
·
00B7
183
¸
00B8
184
¹
00B9
185
º
00BA
186
»
00BB
187
¼
00BC
188
½
00BD
189
¾
00BE
190
¿
00BF
191
C- À
00C0
192
Á
00C1
193
Â
00C2
194
Ã
00C3
195
Ä
00C4
196
Å
00C5
197
Æ
00C6
198
Ç
00C7
199
È
00C8
200
É
00C9
201
Ê
00CA
202
Ë
00CB
203
Ì
00CC
204
Í
00CD
205
Î
00CE
206
Ï
00CF
207
D- Ð
00D0
208
Ñ
00D1
209
Ò
00D2
210
Ó
00D3
211
Ô
00D4
212
Õ
00D5
213
Ö
00D6
214
×
00D7
215
Ø
00D8
216
Ù
00D9
217
Ú
00DA
218
Û
00DB
219
Ü
00DC
220
Ý
00DD
221
Þ
00DE
222
ß
00DF
223
E- à
00E0
224
á
00E1
225
â
00E2
226
ã
00E3
227
ä
00E4
228
å
00E5
229
æ
00E6
230
ç
00E7
231
è
00E8
232
é
00E9
233
ê
00EA
234
ë
00EB
235
ì
00EC
236
í
00ED
237
î
00EE
238
ï
00EF
239
F- ð
00F0
240
ñ
00F1
241
ò
00F2
242
ó
00F3
243
ô
00F4
244
õ
00F5
245
ö
00F6
246
÷
00F7
247
ø
00F8
248
ù
00F9
249
ú
00FA
250
û
00FB
251
ü
00FC
252
ý
00FD
253
þ
00FE
254
ÿ
00FF
255

Leyenda: las celdas amarillas son caracteres de control, las celdas azules son puntuación, las púrpuras son números, las verdes son letras ASCII, y las de color canela son letras internacionales.

Según la información de las webs de Microsoft y del Consorcio Unicode, las posiciones 81, 8D, 8F, 90, y 9D no se usan. Sin embargo, lla llamada a la API de Windows que convierte de páginas de códigos a Unicode mapea estas a las correspondientes códigos de control C1. El símbolo del Euro en la posición 80 no estaba en versiones anteriores de esta página de códigos, ni tampoco las S y Z con carón (háček).

Enlaces externos

  • Windows 1252 reference chart
  • IANA Charset Name Registration
  • Unicode mapping table for Windows 1252
  • Unicode mappings of windows 1252 with "best fit"

Referencias

  1. HTML 5 Draft Recommendation — 20 April 2009, 2.8 Character encodings, retrieved [2009-04-20].
  2. http://blogs.msdn.com/oldnewthing/archive/2004/05/31/144893.aspx
  3. Unicode mappings of windows 1252 with "best fit"
  •   Datos: Q2736131

windows, 1252, 1252, codificación, caracteres, alfabeto, latino, usada, defecto, cuando, unicode, componentes, oficiales, microsoft, windows, inglés, algunos, lenguajes, occidentales, versión, código, páginas, windows, está, paquetes, latex, cual, refiere, com. Windows 1252 o CP 1252 es una codificacion de caracteres del alfabeto latino usada por defecto cuando unicode no se usa en los componentes oficiales de Microsoft Windows en ingles y en algunos lenguajes occidentales Es una version en la que el codigo de paginas de Windows esta en los paquetes de LaTeX el cual se refiere como ansinew Windows 1252 Los puntos azules significan codigos sin uso Indice 1 Detalles 2 Diseno de la codificacion de caracteres 3 Enlaces externos 4 ReferenciasDetalles EditarEsta codificacion es un superconjunto de ISO 8859 1 pero difiere de la ISO 8859 1 de IANA por el uso de caracteres no imprimibles en vez de caracteres de control en el rango 0x80 a 0x9F Es conocido en Windows como el codigo de caracteres numero 1252 y con el nombre de windows 1252 aprobado por la IANA Este codigo de caracteres tambien incluye todos los caracteres imprimibles de ISO 8859 15 algunos mapeados a diferentes posiciones Es muy comun confundir la codificacion de caracteres Windows 1252 con la de ISO 8859 1 El resultado habitual era que todas las comillas y apostrofos producidos por las comillas inteligentes en software Microsoft eran reemplazadas por signos de interrogacion o por cajas en sistemas operativos no Windows haciendo que el texto resultara dificil de leer La mayoria de los navegadores modernos y clientes de correo electronico tratan la codificacion de caracteres de MIME ISO 8859 1 como Windows 1252 con el fin de paliar esta confusion Este es uno de los estandares en las especificaciones de HTML 5 que requieren una interpretacion de ISO 8859 1 en Windows 1252 1 Historicamente el termino ANSI code page ACP se usa en Windows para referirse a varias paginas de codigos consideradas como nativas La intencion era que la mayoria de estas fueran estandares ANSI como lo es el ISO 8859 1 Incluso Windows 1252 fue la primera y de lejos la mas popular pagina de codigos de los idiomas que soporta Microsoft Windows y sin embargo jamas ha sido un estandar ANSI Microsoft establece que El termino ANSI usado para indicar a los codigos de pagina Windows es una referencia historica pero actualmente es un termino equivocado que aun continua persistente en la comunidad de Windows 2 Diseno de la codificacion de caracteres EditarLa siguiente tabla muestra la codificacion Windows 1252 con las diferencias con la codificacion ISO 8859 1 marcadas con bordes gruesos y asteriscos Cada caracter se muestra con su equivalente en Unicode y con su codigo en decimal Microsoft cita el mapeo de los caracteres con Unicode con el mejor ajuste 3 el cual incluye los cinco caracteres no mapeados asi como los caracteres mapeados al 1252 que estan obsoletos Windows 1252 CP1252 0 1 2 3 4 5 6 7 8 9 A B C D E F0 NUL00000 SOH00011 STX00022 ETX00033 EOT00044 ENQ00055 ACK00066 BEL00077 BS00088 HT00099 LF000A10 VT000B11 FF000C12 CR000D13 SO000E14 SI000F151 DLE001016 DC1001117 DC2001218 DC3001319 DC4001420 NAK001521 SYN001622 ETB001723 CAN001824 EM001925 SUB001A26 ESC001B27 FS001C28 GS001D29 RS001E30 US001F312 SP002032 002133 002234 002335 002436 002537 amp 002638 002739 002840 002941 002A42 002B43 002C44 002D45 002E46 002F473 0 003048 1 003149 2 003250 3 003351 4 003452 5 003553 6 003654 7 003755 8 003856 9 003957 003A58 003B59 lt 003C60 003D61 gt 003E62 003F634 004064 A 004165 B 004266 C 004367 D 004468 E 004569 F 004670 G 004771 H 004872 I 004973 J 004A74 K 004B75 L 004C76 M 004D77 N 004E78 O 004F795 P 005080 Q 005181 R 005282 S 005383 T 005484 U 005585 V 005686 W 005787 X 005888 Y 005989 Z 005A90 005B91 005C92 005D93 005E94 005F956 006096 a 006197 b 006298 c 006399 d 0064100 e 0065101 f 0066102 g 0067103 h 0068104 i 0069105 j 006A106 k 006B107 l 006C108 m 006D109 n 006E110 o 006F1117 p 0070112 q 0071113 r 0072114 s 0073115 t 0074116 u 0075117 v 0076118 w 0077119 x 0078120 y 0079121 z 007A122 007B123 007C124 007D125 007E126 DEL007F1278 20AC128 201A130 ƒ 0192131 201E132 2026133 2020134 2021135 ˆ 02C6136 2030137 S 0160138 2039139 Œ 0152140 Z 017D142 9 2018145 2019146 201C147 201D148 2022149 2013150 2014151 02DC152 2122153 s 0161154 203A155 œ 0153156 z 017E158 Ÿ 0178159 A NBSP00A0160 00A1161 00A2162 00A3163 00A4164 00A5165 00A6166 00A7167 00A8168 c 00A9169 ª 00AA170 00AB171 00AC172 SHY00AD173 00AE174 00AF175B 00B0176 00B1177 00B2178 00B3179 00B4180 µ 00B5181 00B6182 00B7183 00B8184 00B9185 º 00BA186 00BB187 00BC188 00BD189 00BE190 00BF191C A 00C0192 A 00C1193 A 00C2194 A 00C3195 A 00C4196 A 00C5197 AE 00C6198 C 00C7199 E 00C8200 E 00C9201 E 00CA202 E 00CB203 I 00CC204 I 00CD205 I 00CE206 I 00CF207D D 00D0208 N 00D1209 O 00D2210 o 00D3211 O 00D4212 O 00D5213 O 00D6214 00D7215 O 00D8216 U 00D9217 U 00DA218 U 00DB219 U 00DC220 Y 00DD221 TH 00DE222 ss 00DF223E a 00E0224 a 00E1225 a 00E2226 a 00E3227 a 00E4228 a 00E5229 ae 00E6230 c 00E7231 e 00E8232 e 00E9233 e 00EA234 e 00EB235 i 00EC236 i 00ED237 i 00EE238 i 00EF239F d 00F0240 n 00F1241 o 00F2242 o 00F3243 o 00F4244 o 00F5245 o 00F6246 00F7247 o 00F8248 u 00F9249 u 00FA250 u 00FB251 u 00FC252 y 00FD253 th 00FE254 y 00FF255Leyenda las celdas amarillas son caracteres de control las celdas azules son puntuacion las purpuras son numeros las verdes son letras ASCII y las de color canela son letras internacionales Segun la informacion de las webs de Microsoft y del Consorcio Unicode las posiciones 81 8D 8F 90 y 9D no se usan Sin embargo lla llamada a la API de Windows que convierte de paginas de codigos a Unicode mapea estas a las correspondientes codigos de control C1 El simbolo del Euro en la posicion 80 no estaba en versiones anteriores de esta pagina de codigos ni tampoco las S y Z con caron hacek Enlaces externos EditarWindows 1252 reference chart IANA Charset Name Registration Unicode mapping table for Windows 1252 Unicode mappings of windows 1252 with best fit Referencias Editar HTML 5 Draft Recommendation 20 April 2009 2 8 Character encodings retrieved 2009 04 20 http blogs msdn com oldnewthing archive 2004 05 31 144893 aspx Unicode mappings of windows 1252 with best fit Datos Q2736131 Obtenido de https es wikipedia org w index php title Windows 1252 amp oldid 130116401, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos