fbpx
Wikipedia

Wikipedia discusión:Corrector ortográfico

Comentario de agosto de 2010

El corrector no funciona con el beta!. Ni con el skin Vector.--D96  @¿¿que??@ 15:23 21 ago 2010 (UTC)

Pues no lo entiendo, con este títere utilizo Vector y no tengo problema alguno, ¿hay alguien más con problemas? ¿te funciona con monobook? saludos! El mago de la Wiki   Hablémoslo 19:10 21 ago 2010 (UTC)

Anexos

Me da la impresión que la herramienta del correcto no funciona en artículos anexos. Es así? --Edwod2001 (discusión) 13:58 20 sep 2010 (UTC)

Gramática

Se podría añadir está herramienta o crear otra con la capacidad de detectar errores gramaticales en las diferentes páginas de wikipedia. Saludos. Juan Miguel (discusión) 03:56 30 nov 2010 (UTC)

Aún/aun

El corrector marca como incorrecta la forma "aun" siempre, aunque cuando equivale a "incluso" se escribe sin acento. —résped ¿sí? 16:08 23 dic 2010 (UTC)

Así es, si bien, cuando se pasa el ratón por encima de la palabra aparece una aclaración: "aún (cuando pueda sustituirse por todavía)". Si no es suficiente y son demasiados los "falsos positivos", entonces se elimina del listado, no hay problema. ¿Alguna otra opinión? Poco2 16:29 23 dic 2010 (UTC)
Prefiero algún "falso positivo" a que se queden sin corregir los errores (cuando pueda sustituirse por todavía). Antón Francho (si me quieres decir algo) 20:27 2 ene 2011 (UTC) P.D. Con mi mayor respeto, he añadido el acento que faltaba en tu aclaración.

Iria

"Iria" en mayúscula es un nombre propio de persona, pido a ver si se puede poner para que no sea una falta. -- Vivaelcelta {discusión  · contribuciones} 16:34 8 ene 2011 (UTC)

Es un nombre poco frecuente. Doy por hecho que son más los errores reales que los falsos positivos, y por ello abogo por dejarlo como está. También incluimos formas como "ultimo", que un corrector convencional aceptará (1. persona singular de ultimar), pero nosotros marcamos como error, dado que un verbo conjugado en primera persona es muy poco frecuente y, por otro lado, son muchos los que olvidan el acento en último. Poco2 17:18 8 ene 2011 (UTC)

Ferrari

Cuando aparece este nombre en algún artículo, el corrector lo marca como erróneo y propone como cambio "cs". Tal cual. ¿Es un error mío o es así? Adrgs (disc. · contr. · bloq.) 21:59 2 feb 2011 (UTC)

  Corregido (mañana estará activo) era un error en el listado, gracias y saludos, Poco2 22:16 2 feb 2011 (UTC)

¿Bug?

Hola. Llevo usando el corrector, además del Twinkle y el Monobook suite (lo digo por si hay algún problema de compatibilidad) desde hace varios meses, y hasta ahora no había tenido ningún problema. Desde hace algunos días, el Twinkle me daba algún fallo, en el sentido de que no me llegaba a salir (como si estuviese desactivado) en algunas páginas, pero se solucionaba con recargar la misma una o dos veces, por lo que no le di importancia. Pero desde hoy mismo, el corrector ortográfico también me falla, ya que en algunos artículos me marca todas las palabras como "incorrectas", resalta absolutamente todas en artículos como Telecinco. El problema, es que en artículos un poco grandes (como Telecinco) me bloquea todas las pestañas de Wikipedia (uso Google Chrome) durante varios minutos (dependiendo del tamaño del artículo, en Telecinco me llegó a los 10 minutos), llegando a consumir 300 mb de memoria RAM y usando el 80% de la CPU sólo con esa pestaña. Se hace difícil el mantenimiento así, por lo que antes de desactivar todo, me gustaría saber si a alguien más le pasa. Gracias de antemano, un saludo.   Adriansm (Dímelo a la cara) 12:24 2 mar 2011 (UTC)

Te doy un repro (o séase, un "me pasa también"). El artilugio en estos momentos marca todas o al menos un 90% de las palabras en los artículos como erróneas y en las páginas bastante largas consigue colgar el navegador (todos, IE9, Safari, Opera, Chrome, Firefox, lo cual es de por sí impresionante para un sistema potente como el mío de 4 núcleos). Quizá pueda deberse a la transición a la nueva versión de Wiki. Por ahora, te recomiendo desactivarlo hasta que se solvente el problema. --Linfocito ~ Salu2 desde Colombia. 16:36 2 mar 2011 (UTC)
Hola. Tengo el mismo bug con el corrector. A ver si se arregla pronto... De hecho, me he fijado en que palabras pequeñas como preposiciones y artículos en femenino plural, no los resalta. Bueno, espero que pronto esté arreglado. Un saludo. **Kingpowl** (discusión) 16:41 2 mar 2011 (UTC)

Tilde diacrítica

¿Hay alguna opinión y/o consenso sobre la inclusión de palabras con tilde diacrítica en esta lista? Lo digo por la presencia de aun, sin tilde, que produce muchos "falsos positivos". Saludos, Gons (¿Digame?) 18:10 4 mar 2011 (UTC).

Disregard, hice una búsqueda rápida de diacrítico/a, pero no de aun, así que no había leído que ya hablastéis del tema... Gons (¿Digame?) 18:13 4 mar 2011 (UTC).
En realidad, creo que hay un problema importante de "falsos positivos"; la cantidad de palabras listadas donde varias opciones son correctas que hay ahora (acabo de ver impulso / impulsó) hace que esta herramienta pierda su eficacia. Creo que solo se deberían listar palabras con faltas de ortografía. Escarlati - escríbeme 11:53 17 mar 2011 (UTC)
¿Qué ventaja presentaría entonces esta herramienta con respecto, por ejemplo, al corrector del navegador? ¿no crees que términos como "ultimo" que si bien sí existen, deberían detectarse como positivos, dado que la cantidad de falsos positivos serían ínfima con respecto a la cantidad de errores que se detectan?. El término impulso sí me parece demasiado frecuente como para añadirlo en la lista de errores, pero muchos otros sí me parecen adecuados, y precisamente ahí radica el beneficio de la herramienta. Poco2 19:33 17 mar 2011 (UTC)
Por eso: hablo de términos que son muy frecuentes, como impulso, que lo es bastante, y están proliferando últimamente mucho estos términos correctos y con una cierta frecuencia de uso, hasta tal punto que yo he tenido que quitarme el corrector porque la mayor parte de los términos que señala son en realidad correctos, y entorpece la tarea de corregir ortografía en lugar de ayudar. Escarlati - escríbeme 18:00 18 mar 2011 (UTC)
Ok, entonces estoy de acuerdo contigo. ¿De qué términos estamos hablando?, Poco2 18:54 18 mar 2011 (UTC)

Según

Hola, « junio 330 a.C. (según el ...» muestra seg como abreviación de segundo y sugiere «s».--Jeruus (discusión) 02:13 28 dic 2011 (UTC)

Aquí no, no entiendo porqué.--Jeruus (discusión) 02:23 28 dic 2011 (UTC)
He tratado de explicar el motivo aquí. Saludos, Poco2 09:21 28 dic 2011 (UTC)

Fábula, Fabular, y derivados

Al parecer no reconoce el verbo Fabular y sus formas, muestra un falso positivo, ya que reconoce el verbo como si quisiera escribir Fábula. --  ●Dark Bane●™]»»…♠♠ (Tu me diras)-Contribuciones 09:27 3 ene 2012 (UTC)

Hola

Yo es que prefiero no tocar nada, que me conozco :) El caso es que el corrector marca como error "cafe" cuando está dentro de la palabra cafeína, supongo que ahora también lo hará :P Saludetes. --Ensada mensajes aquí 01:40 7 feb 2012 (UTC)

Ay, que en las discus no va XD Se puede ver aquí :) --Ensada mensajes aquí 01:42 7 feb 2012 (UTC)
Hola Ensada. Es una limitación técnica de los navegadores web cuando interactúan con el corrector y no puede ser solucionado; puedes leerlo aquí. --Linfocito B ~ Salu2 desde Colombia. 18:29 7 feb 2012 (UTC)

Funcionamiento

No se que tan complejo sea, solo quiero comentar que sería útil que funcione dentro del MediaWiki QuickEdit 2.4 porque generalmente cuando hay varios errores hay que abrir la página en una pestaña y el editor en otra,también sería muy útil que las remarque dentro del editor (como hace el WikiEd)--  Esceptic0 | ✉ ✍. 02:39 27 jun 2012 (UTC)

Propuesta

Actualmente el corrector sólo funciona en los artículos y anexos, pero hay páginas de Wikipedia que deben estar escritas correctamente, como las de tipo wikipedia. Por eso propongo ampliar el campo de actuación del corrector a: Wikipedia, Plantilla, Ayuda, Wikiproyecto... --Vivaelcelta {discusión · contribuciones} 12:51 7 sep 2012 (UTC)

  A favor Y, salvo que alguien me desmienta, también en las paginas de discusión. Una enciclopedia debería estar bien escrita por completo. Saludos, Gons (¿Digame?) 23:08 17 may 2013 (UTC).

Otras propuestas

¿Qué opinan señores y señoras?

  • Paréntesis. En español, como sabrán seguro, se inicia dentro del paréntesis con minúscula (salvo donde corresponda mayúscula por la palabra en sí). Podriamos poner (A, (B, (C... y así todo el abecedario. También se podría poner con los "dos puntos", aunque crearía más falsos positivos, porque hay más excepcions.
  • Ordinales. Como podéis ver en el enlace, la forma correcta de usarlos en español es 1.º, 2.ª, 3.er y, de paso, N.º. Podriamos también incluirlos en la lista, para sustituir 1o, 2ª o No. Este último punto habría que asegurarse que es técnicamente posible.

Quedo a la espera. Saludos, Gons (¿Digame?) 23:06 17 may 2013 (UTC).

  A favor Además, también cambiaría los puntos suspensivos que se hayan introducido con tres caracteres de punto por el solo carácter « … », aunque sería deseable en ese caso que este carácter apareciera en la lista de caracteres especiales bajo la caja de edición. --Benjavalero (discusión) 12:47 11 mar 2014 (UTC)

Toolserver

Hello everybody. As you might know, the Toolserver will soon die. I moved the spellcheck scripts to Tool Labs. So please change the script: the new URL to checkArticle.php is: http://tools.wmflabs.org/spellcheck/es/checkArticle.php . Thank you. --APPER (discusión) 23:35 31 oct 2013 (UTC)

  Hecho --Taichi 02:04 1 nov 2013 (UTC)

Problemas

Buenos días. Tengo un problema en el que el corrector ortográfico no funciona. Tal vez sea porque el script no fue correctamente editado. Gracias. --Tomyeze (discusión) 16:46 2 nov 2013 (UTC)

  Resuelto aquí; tras el cambio anterior faltaba el nombre del parámetro con la página a corregir. - José Emilio –jem– Tú dirás... 13:16 7 nov 2013 (UTC)

No funciona

A día 6 de noviembre --Jakeukalane (discusión) 13:57 6 nov 2013 (UTC)

  Resuelto aquí; tras el cambio anterior faltaba el nombre del parámetro con la página a corregir. - José Emilio –jem– Tú dirás... 13:16 7 nov 2013 (UTC)

Musica

Hola... se me hace que le falta resaltar la palabra 'musica/Musica', ya que la correcta es 'música/Música'. Saludos, Giliofelix (responder) 16:38 4 abr 2014 (UTC)

Bueno, no hace falta en el listado, solo no lo está resaltando. Giliofelix (responder) 16:44 4 abr 2014 (UTC)

¿Certificar la ortografía?

Como se ve por la discusión, el corrector automático trae problemas, porque el rojo dificulta la lectura inútilmente, sobre todo en palabras comunes, como aun y voces verbales del tipo ultimo, ultimó, dejo, etc. Además, palabras escritas de manera anticuada abundan en las citas literarias (hasta hace un siglo la preposición a se escribía a menudo á, etc.). Hay otros problemas, como el del doble acento: Oscar vs. Óscar (ambos existen), exégeta vs. exegeta (=), o apellidos como Perez (hay quien lo escribe sin tilde) o Martin vs. Martín. - Pregunta: ¿no se podría introducir un parámetro de certificación? Es decir, cuando abrimos una página poder indicar que la propuesta de corrección es superflua? Es como introducir una corrección de erratas, pero marcar la palabra para que el corrector la ignore entraña un problema técnico: ¿disponer de un carácter invisible o un formato distinto, mejor si es invisible? Gracias.--Sever Juan (discusión) 22:00 5 abr 2014 (UTC)

  •   Comentario. Se trató Cómo "engañar" al corrector este tema en el Café hace poco. Un saludo, --Technopat (discusión) 08:34 13 abr 2014 (UTC)

Ayuda con el funcionamiento del corrector en la wikipedia en gallego

Hola, necesito un poco de ayuda para mejorar el funcionamiento de este corrector que tenemos instalado en la wikipedia en gallego, pregunto aquí porque si alguien puede ayudarme un poco con la parte técnica. El caso es que en esta página he realizado una prueba de funcionamiento y he detectado dos cosas que no me "cuadran":

  • en la lista de palabras a revisar tenemos incluído el texto "la||a" pero en el texto de prueba que he indicado detecta "La" y lo marca como incorrecto pero no marca "la", ¿porqué?
  • en los últimos días parece que no hace caso a las nuevas palabras que se añaden al listado, se puede comprobar en el historial la inclusión de canica y gobierno pero no se detectan en la página de prueba. ¿Esto también pasa en es.wiki?

Si alguien entiende algo de cómo funciona y cómo debe actualizarse el corrector y puede echar un vistazo a la instalación en gl.wiki para echarnos una mano se lo agradecería. Saludos, --Elisardojm (discusión) 19:11 12 may 2014 (UTC)


Hola, Elisardojm. Copio mi respuesta aquí y en gl.wiki porque resultará igualmente útil en ambos proyectos. Para poder aclarar tus dudas he tenido que investigar el código del corrector en Labs, e incluso hacer unas pruebas más específicas con modificaciones de su código en mi propia cuenta de Labs; afortunadamente el corrector está programado en PHP, mi lenguaje habitual, y por eso he podido profundizar en ello. Realmente ha sido interesante e instructivo averiguar o deducir las soluciones que ha buscado otro programador (en algunos casos creo que mejorables, pero yo tampoco me libraría de críticas si se revisara mi trabajo).

Antes de nada hay que explicar cómo funciona el corrector; trataré de hacerlo sin meterme en demasiados detalles técnicos.

Cuando el corrector lee el texto de la página a corregir, y antes de contrastarlo con la lista de palabras «erróneas», primero hace un filtrado de todos los caracteres que no sean letras, dejando espacios en su lugar (llamo a esta operación R0), y a continuación intenta eliminar tanto las palabras de una (sea R1) como de dos letras (sea R2). Es decir, de entrada, y aunque no parece estar documentado oficialmente, la intención del programador es claramente no considerar las palabras ni de una ni de dos letras, por lo que no serviría de nada que estén en el listado. Ahora bien; dije «intenta eliminar» y no «elimina» porque, en el código, la expresión regular usada para ejecutar R1 y R2 puede «traducirse» así: «sustituir los bloques de texto que consten de un espacio (en adelante, E1), un carácter (R1)/dos caracteres (R2) cual(es)quiera (ya solo pueden ser letras, pues R0 se hace antes) y otro espacio (en adelante, E2), por un espacio».

El problema es que esos bloques se delimitan una sola vez al principio y sin solapamiento entre ellos; por lo tanto, cuando dos palabras de una letra aparecen consecutivamente, por ejemplo en «y a veces...», se detecta la «y» y se toma su E2, pero al quedar dentro de ese bloque, ese espacio ya no puede funcionar como E1 para «a»; el resultado es que «a» no es afectada por R1, ni eliminada. Siguiendo el razonamiento, si hubiera una tercera palabra de una letra consecutiva, sí se detectaría, pero una cuarta no, etc. Exactamente lo mismo pasa con las series de palabras consecutivas de dos letras en R2. La alternancia entre palabras de una y dos letras no causa problema y todas son eliminadas, porque primero se completa R1 y solo con el texto resultante se hace R2, formándose nuevos bloques. Otra consecuencia interesante de esto es que si hay una palabra de una o dos letras exactamente al comienzo o al final del wikitexto, tampoco es eliminada, porque le faltaría su E1 o su E2, respectivamente (lo segundo es casi imposible que suceda, porque al final debería haber categorías, e incluso si hay una frase, esta debería terminar en punto, que por R0 quedaría convertido en espacio, y ya tendríamos el E2).

Sigamos. Una vez depurado el texto de entrada con esos reemplazos y otros menores que ya no vienen al caso aquí, se divide el texto final palabra por palabra dividiendo por los espacios, y, atención, se eliminan los duplicados de la lista de palabras resultante, lo cual implica que cada palabra solo aparecerá una vez (lo llamo A1), pero las variantes que solo cambian en el uso de mayúsculas o minúsculas sí estarán por separado (A2), ya que por defecto PHP trabaja con distinción de casos. Ahora, con esa lista final, vamos contrastando para cada palabra si, pasada a minúsculas, está en la lista de errores «normal», o si, tal cual, está en la lista de errores «cs» (con distinción de mayúsculas). Si hay coincidencia, se devuelve la indicación para que esa palabra sea marcada con la corrección sugerida asociada, y, como es una indicación referida simplemente a la palabra, sin especificar posiciones ni contextos, será válida para cualquier aparición de esa palabra en el wikitexto (esto explica A1); además, habrá indicaciones propias para las posibles variantes con distinción de caso (por A2), necesarias para que se marquen correctamente. Esas indicaciones son las que llegan al navegador a través del código Javascript del accesorio y hacen que aparezcan las marcas en fondo rojo.

Una vez explicado todo esto, estamos en condiciones de analizar los casos «extraños» en el texto actual de tu prueba (añado enlace permanente para dejar el contexto adecuado en consultas futuras):

  • «la» (en minúsculas): En «en la Junta», el «la» no se elimina en R2 por ir detrás de otra palabra de dos letras, con lo que pasa a la comparación con el listado; como sí tenemos «la||a» en él, se genera una indicación para todos los «la» del texto, con lo cual se marcan los otros dos «la», independientemente de su contexto (pero no los «La», por A2). El segundo «la», que también va detras de «en», también habría causado por sí solo que todos los «la» quedaran marcados, pero el tercero no, conforme a todo lo expuesto.
  • «La» (en mayúsculas): En «no en La Isla», el «La» sí se elimina en R2 por ser la tercera palabra consecutiva de dos letras, conforme se ha explicado. Las demás «La» del texto también se eliminan normalmente, al no tener palabras de dos letras delante. Por ello, no pasa a la comparación y no se genera la indicación.

Y por eso los «la» se marcan y los «La» no se marcan. Puedes probar a hacer cambios y verás que todos los resultados podrán explicarse con lo que he dicho.

En cuanto a las palabras añadidas recientemente, la explicación es más sencilla y obvia: los ficheros con las listas de palabras a corregir en cada idioma se actualizaron por última vez el 30 de abril a las 4 h UTC, cuando en teoría se actualizan a diario. En es.wiki no lo hemos notado porque no ha habido cambios desde entonces. Imagino que se deberá a algún problema en el crontab (gestor de tareas programadas de Linux), pero eso solo puede aclararlo el programador.

Y anticipándome a la siguiente pregunta: ¿soluciones? Personalmente yo eliminaría al menos el R2 y tal vez el R1, ya que realmente no veo sus beneficios, y sí las complicaciones para hacer que funcionen siempre, sin los «agujeros» que he explicado. Así se podrían admitir y gestionar sin problemas las palabras de dos ¿y una? letras, en cualquier posición. Y ya puestos, se podrían analizar otras posibles mejoras y optimizaciones (me resulta particularmente sorprendente en lo negativo la duplicación total del código entre idiomas, que complica cualquier mantenimiento futuro). Todo esto podría conseguirse: preferiblemente, por intervención directa del programador, previa explicación a él de los problemas de los reemplazos y del crontab; alternativamente, proponiéndole que me añadiera a mí como gestor de la herramienta spellcheck en Labs, de forma que yo mismo podría acceder y modificar su código y el crontab; y en última y muy poco deseable instancia, si el programador no pudiera o no quisiera hacer nada, por copiado y modificación y ejecución por mí mismo de la herramienta y el crontab en mi cuenta/herramienta de Labs (o creándome una nueva herramienta), y cambiando los enlaces en nuestras Wikipedias. En cualquier caso, el primer paso sería contactar con el programador. Ya me comentarás, seguiré atento al asunto. - José Emilio –jem– Tú dirás... 11:31 19 may 2014 (UTC)

Lo primero de todo, muchísimas gracias Jem por tu esfuerzo y estupendo análisis, con el se aclara un poco el funcionamiento "extraño" que tiene algunas veces el corrector. Lo que no entiendo es por qué el corrector pretende ignorar las palabras de una y dos letras, esto para nosotros es un problema porque hay bastantes casos en los que necesitamos realmente corregir palabras con estas longitudes. Lo único que se me ocurrre es que se "salte" esas palabras para mejorar el rendimiento y así no ralentizar en exceso la carga de las páginas. Pero sería interesante preguntarle al programador sobre este tema. Tema a parte es que la eliminación de esas palabras sea incorrecta, si tienen que eliminarse por motivos de rendimiento tienen que eliminarse en todos los casos porque de otra forma una palabra incorrecta se detecta en unos casos y en otros no y esto provoca que se desconfíe del correcto funcionamiento del programa.
Estoy de acuerdo contigo en que se debe contactar con el programador pero el problema es que yo no sé alemán y mi inglés no llega para explicar algo que medio-entiendo, ¿quién se podría encargar de tratar con el para ver si se pueden solucionar estos problemas y que arregle el crontab? Saludos, --Elisardojm (discusión) 00:52 22 may 2014 (UTC)
Aquí va una posible explicación resumida de los problemas y soluciones en inglés, que puedes retocar, para dejarle al programador (según lo que hemos hablado en IRC), Elisardojm. Seguiré al tanto de las novedades.

Hi. We've noted a couple of problems with the Spellchecker (verifíquese si es el nombre «oficial» que le da al accesorio) in eswiki and glwiki. First of all, the lists of words aren't being updated since April 30 (perhaps there is a problem with your crontab in Labs?); and second, the behaviour for words with one or two letters is problematic. After analysing the code in Labs, we've seen that such words are supposedly being removed before the comparison with the wrong words list, but, in fact, in the way the regex is built, when a series of consecutive one or two-letter-words appears, the even ones (second, fourth and so) aren't removed, as the first space for the regex is already used as the last space for the previous word. Also, as spaces are needed, the words aren't removed if they are the very first thing in the wikitext (or the very last, but this would be almost impossible in real wikis). We think it would be easier and better to just remove those replacement regexs and allow such words, or at least two letter words, as this is not documented, there are cases of use for them in glwiki, and we don't see a real performance problem there. If you need help with this or the tool maintenance in general, -jem- offers himself to help from his Labs account. Thanks in advance and we wait for your answer.

- José Emilio –jem– Tú dirás... 19:49 25 may 2014 (UTC)
Ya ha respondido APPER y se ha solucionado todo, muchas gracias -jem-!! Comenta que se olvidó de cambiar el crontab cuando se cambió el sistema del toolserver y que ahora ya está activo. Sobre el problema de las palabras de una y dos letras comenta que ha quitado esas limitaciones para gl y es, y ahora todo funciona genial. Comenta además que si quieres te puede añadir como "mantenedor" de la herramienta, tu dirás.
Bueno pero esto no es todo, esta era la parte urgente, ahora viene la parte buena -jem- :). Ya desde hace mucho tiempo me di cuenta de que el corrector parece que no funciona en páginas de tamaño medio y grandes. Mira por ejemplo esta página, en el apartado de obra, debería marcar en rojo las palabras "La", y otras (como se puede ver en la página de pruebas), como hace en la página de prueba, sin embargo no se marca ninguna palabra incorrecta en todo el artículo. ¿Esto es debido a que el corrector no se activa en páginas que superan un determinado tamaño por motivos de rendimiento o algo así? ¿O quizás es porque hay demasiados errores en la página? En la página de prueba he metido un error entre comentarios wiki y por la razón que sea ya no me marcó ninguno :) Me da la impresión de que si un error se repite más de X veces entonces ya no marca nada...Saludos, --Elisardojm (discusión) 12:25 2 jun 2014 (UTC)

Corrector ortográfico y los falsos positivos.

Hola, Quería preguntar si hay alguna forma de quitar el fondo rojo de la palabras que están bien escritas -creo que se denomina "falsos positivos"-, y que son correctas según el sentido del texto, o el idioma utilizado dentro de otro idioma.--Jesús (discusión) 23:09 7 feb 2016 (UTC)

Jesús: En términos generales y por ahora, no, pero hay algunas formas de paliar/reducir algo el problema. Más detalles en mi respuesta a Rauletemunoz unos hilos más abajo. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Información obsoleta

Parece que la información en Wikipedia:Corrector ortográfico#Problemas técnicos y limitaciones se ha quedado obsoleta. No veo que el corrector marque las palabras con caracteres ASCII como "según". Afortunadamente parece que la información sobre ese problema ya no es relevante. Sugiero eliminarla del artículo (yo no puedo hacerlo porque aún no estoy autoconfirmado). Alonso (discusión) 13:04 5 may 2016 (UTC)

Alonso: El problema persiste y nunca ha desaparecido, pero hay que señalar que únicamente se da en los artículos donde aparecen tanto la palabra errónea (positivo correcto, p. ej. «seg») como la palabra que genera el falso positivo por prolongación de la anterior que empieza con un carácter especial (p. ej. «según»). Véase el artículo Segundo. Habría que mejorar la explicación, pero lo ideal sería revisar el código PHP en Toolforge para hacer que detecte y devuelva otro tipo de indicación asociada a esas palabras para que el Javascript local no marque el falso positivo. Es algo que plantearé y probablemente abordaré más adelante. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Añadir palabra

Añadir palabra al corrector. Palabra a corregir pins correcto pines. --Jcfidy (discusión) 05:44 3 ago 2017 (UTC)

  Añadida como puedes ver. Gracias por avisar. Saludos. Antón Francho (si me quieres decir algo) 19:02 13 ago 2017 (UTC)

Sólo/solo

Creo que ocurre lo mismo que en el caso de "aún". Regularmente marca como error, como falso positivo, las redacciones en que se usa "sólo" de manera correcta. Ej: sólo puede hacer referencia. No sé si hay acción posible al respecto. Saludos GinkgoBiloba (discusión) 05:11 28 oct 2017 (UTC)

  No, la RAE ya no reconoce la palabra sólo, actualmente se debe de utilizar siempre la palabra sin tilde. Jcfidy (discusión) 08:21 28 oct 2017 (UTC)

Error en el código fuente

Me parece se debe revisar el código fuente del corrector, pues para el caso de la palabra "capitanía" arroja falto positivo, piensa que es "capitan". Ver el artículo Virreinato de Nueva España -- oSepu   (Discusión) 20:34 20 may 2018 (UTC)

Es decir el tilde lo está tomando como fin de palabra -- oSepu   (Discusión) 23:20 3 jun 2018 (UTC)
Hola, oSepu. Es una limitación técnica/error ya conocido que se explica aquí. Solo sucede porque la palabra que genera el positivo correcto, «capitan» sin tilde, también aparece en el artículo, concretamente en una cita de este apartado. Sería bueno comprobar si en el castellano antiguo original efectivamente no hay tilde; de ser así, de momento no hay solución, aunque en un futuro se podría plantear tanto omitir el contenido de las citas al procesar el texto como excluir explícitamente las palabras susceptibles de falso positivo que se detecten en el procesamiento. Es algo que plantearé y probablemente abordaré más adelante. - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)

Página con muchos errores

Buenos días a todos. En pro del Wiktionary inglés, hemos publicado una página que busca palabaras que nos faltan, pero que puede servir también como fuente de errores ortográficos en es.wikipedia - cuentan entre los errores más comunes rehizo, pelicula, despúes, produjó, agsto, posteriomente (170+ veces). He aquí la lista. Como se ve, la palabra más común que nos faltaba era antitanque. Vamos bastante bien en en.wikt en tema del idioma español - tenemos más de 85.000 palabras "bases", sin mencionar los 666.000 de páginas de conyugaciones, plurales o formas de adjectivos. Sin embargo, siempre buscamos a más palabras y a más usuarios. Espero que nuestra página os pueda servir en algo. Un saludo desde en.wikt. --Harmonicaplayer (discusión) 08:05 21 jun 2018 (UTC)

Validación de datos

¿Habría alguna manera de validar datos correctos que aparecen en sombreado rojo? Es decir, por poner un ejemplo, en el artículo Pelotón aparece el término «Company of Heroes» y «Heroes» en rojo porque no lleva tilde. ¿No se podría poner algún tipo de código (yo que sé, no sé de informática, por decir algo, «<Heroes>») para validar este falso positivo? Creo que me he explicado peor que el Pato Donald ebrio.   Rauletemunoz 15:58 16 ago 2018 (UTC)

Hola, Rauletemunoz. Te he entendido bien, pero lo que pides no es sencillo. Cualquier marca en el wikitexto del artículo podría ser confusa para los lectores y editores no avisados, y además tendríamos que conseguir que no produjera efectos en la visualización normal de la página (y con lo de <Heroes>, por ejemplo, es obvio que sí hay un efecto porque los símbolos se ven). Sería preferible trabajar en el código del corrector, ya fuese en la herramienta de Toolforge o en el Javascript local, o en la propia lista de errores. Desde luego como primera opción se podría añadir en el listado que «Heroes» es una alternativa aceptable, como se hace en otros casos susceptibles de falso positivo, para que al menos al pasar el puntero se sepa que puede ser correcto, y sería plausible que en un futuro esos casos de varias opciones se marcaran en un color más suave. Otras opciones a evaluar podrían ser omitir casos en mayúscula (a riesgo de algunos falsos negativos también), omitir texto enlazado y enlazar en este caso porque Company of Heroes existe, o introducir listas de excepciones globales de varias palabras (más complejo porque por ahora el corrector solo trabaja con palabras individuales, pero no imposible). Lo que sí me parece impractible es introducir excepciones (o, como tú las llamas, validaciones) específicas para cada aparición en un artículo, porque con el continuo cambio e incluso eliminación de los wikitextos no habría forma de «anclar» cada caso a una posición numérica (ya fuese de orden de aparición o de número de carácter) y el mantenimiento sería inviable. Todo esto está entre las ideas que preveo plantear y abordar en un futuro junto a otros proyectos... de momento esto te puedo decir, aunque podemos profundizar el debate aquí o en IRC, si lo deseas. Saludos, - José Emilio –jem– Tú dirás... 11:08 17 ago 2018 (UTC)
Vale, a ver si lo he entendido bien -jem-, ¿podríamos de alguna manera decirle al corrector que no ponga en rojo palabras como «fábrica» (establecimiento para fabricar) y fabrica (del verbo fabricar) o, al menos, ponerlas más suaves si pueden ser correctas como este ejemplo? Por cierto, un saludo, que hace tiempo que no hablamos.   Rauletemunoz 22:36 18 ago 2018 (UTC)
Sí, Rauletemunoz, esa es una de las posibilidades que caben si se trabaja a fondo en el código. Para ello, lógicamente, tendríamos que ser estrictos a la hora de redactar el texto de la sugerencia (tooltip) para que se puedan identificar claramente los casos en que hay varias opciones: ahora normalmente se separan con comas y no habría que tener en cuenta lo que pueda estar entre paréntesis, así que podría bastar fijar eso como norma estricta y confiar en que los usuarios estén atentos a cumplirla. Por otra parte, ese cambio y todos los demás que se puedan plantear supondrían en principio separarnos del código original/común, que en teoría está en uso también en las Wikipedias en alemán, gallego y persa, por lo que habría que evaluar bien nuestros recursos y nuestros objetivos, y quizás hablar con el autor, APPER, y con las respectivas comunidades. Finalmente... otro saludo para ti y que hablemos con más frecuencia :). - José Emilio –jem– Tú dirás... 23:00 24 ago 2018 (UTC)

Ocupar este listado en alguna extensión de Chrome

Saben de alguna app o extensión de Chrome que pueda ocupar este listado y mostrar en las web visitadas (no sólo en Wikipedia) los errores ortográficos, sería bastante útil, saludos -- oSepu   (Discusión) 21:10 29 sep 2020 (UTC)

Demostrativos: nunca con tilde.

Habría que retirar del Listado del corrector ortográfico todas las sugerencias de poner tilde a los demostrativos (este, ese, aquel, y sus plurales y femeninos —los neutros nunca han llevado tilde—) cuando funcionan como pronombres. Me refiero a líneas del Listado como la siguiente:

aquél||aquel (determinante y pronombre), aquél (pronombre)

Estas tildes son incorrectas de acuerdo con la Ortografía de 2010, de la Real Academia, que las eliminó al mismo tiempo que eliminaba la tilde de sólo. Véase el comienzo del apartado 3.4.3.3 de la mencionada Ortografía:

La palabra solo... así como los demostrativos este, ese y aquel, con sus femeninos y plurales, funcionen como pronombres (Este es tonto; Quiero aquella) o como determinantes (aquellos tipos, la chica esa), son voces que no deben llevar tilde según las reglas generales de acentuación. (...)

No obstante, las reglas ortográficas venían prescribiendo el uso diacrítico de la tilde en el adverbio solo y los pronombres demostrativos para distinguirlos, respectivamente, del adjetivo solo y de los determinantes demostrativos,...

Sin embargo, puesto que ese empleo tradicional de la tilde diacrítica no opone en estos casos formas tónicas a otras átonas formalmente idénticas (requisito prosódico que justifica el empleo de la tilde diacrítica)..., a partir de ahora se podrá prescindir de la tilde en estas formas incluso en los casos de doble interpretación. (...)

Las posibles ambigüedades son resueltas casi siempre por el propio contexto comunicativo...
Ortografía, 2010, p. 269.

Convendría, pues, eliminar del Listado todas las líneas con demostrativos o, por lo menos, no sugerir que pueden llevar tilde: no la pueden llevar nunca, según la Academia.--Rpajares (discusión) 17:51 24 sep 2021 (UTC)

Volver a la página de proyecto «Corrector ortográfico».

wikipedia, discusión, corrector, ortográfico, aviso, corrector, incluye, también, palabras, están, escritas, correctamente, pero, acento, puede, haber, sido, omitido, error, problemas, teclado, caso, típico, aún, pero, castellano, muchos, más, sobre, todo, ver. AVISO El corrector incluye tambien palabras que estan escritas correctamente pero en las que el acento puede haber sido omitido por error o por problemas de teclado El caso tipico es el de aun vs aun pero en castellano hay muchos mas sobre todo en los verbos dejo vs dejo ultimo y ultimo verbo vs ultimo adjetivo reino vs reino etc Peor aun es la situacion de las citas literarias porque usan ortografias anticuadas que actualmente se rechazan ej guion Desgraciadamente es un engorro porque se trata a menudo de falsos positivos pero todavia no se ha encontrado la manera de certificar ambas ortografias a la vez o de enganar al corrector La discusion esta en curso pero el asunto tiene implicaciones tecnicas y por ahora no se vislumbran soluciones simples Por ello es importante recordar que actualmente el proposito de este corrector es ayudar a detectar errores aun a costa de algunos falsos positivos Indice 1 Comentario de agosto de 2010 2 Anexos 3 Gramatica 4 Aun aun 5 Iria 6 Ferrari 7 Bug 8 Tilde diacritica 9 Segun 10 Fabula Fabular y derivados 11 Hola 12 Funcionamiento 13 Propuesta 14 Otras propuestas 15 Toolserver 16 Problemas 17 No funciona 18 Musica 19 Certificar la ortografia 20 Ayuda con el funcionamiento del corrector en la wikipedia en gallego 21 Corrector ortografico y los falsos positivos 22 Informacion obsoleta 23 Anadir palabra 24 Solo solo 25 Error en el codigo fuente 26 Pagina con muchos errores 27 Validacion de datos 28 Ocupar este listado en alguna extension de Chrome 29 Demostrativos nunca con tilde Comentario de agosto de 2010 EditarEl corrector no funciona con el beta Ni con el skin Vector D96 que 15 23 21 ago 2010 UTC Pues no lo entiendo con este titere utilizo Vector y no tengo problema alguno hay alguien mas con problemas te funciona con monobook saludos El mago de la Wiki Hablemoslo 19 10 21 ago 2010 UTC Anexos EditarMe da la impresion que la herramienta del correcto no funciona en articulos anexos Es asi Edwod2001 discusion 13 58 20 sep 2010 UTC Gramatica EditarSe podria anadir esta herramienta o crear otra con la capacidad de detectar errores gramaticales en las diferentes paginas de wikipedia Saludos Juan Miguel discusion 03 56 30 nov 2010 UTC Aun aun EditarEl corrector marca como incorrecta la forma aun siempre aunque cuando equivale a incluso se escribe sin acento resped si 16 08 23 dic 2010 UTC Asi es si bien cuando se pasa el raton por encima de la palabra aparece una aclaracion aun cuando pueda sustituirse por todavia Si no es suficiente y son demasiados los falsos positivos entonces se elimina del listado no hay problema Alguna otra opinion Poco2 16 29 23 dic 2010 UTC Prefiero algun falso positivo a que se queden sin corregir los errores cuando pueda sustituirse por todavia Anton Francho si me quieres decir algo 20 27 2 ene 2011 UTC P D Con mi mayor respeto he anadido el acento que faltaba en tu aclaracion dd Iria Editar Iria en mayuscula es un nombre propio de persona pido a ver si se puede poner para que no sea una falta Vivaelcelta discusion contribuciones 16 34 8 ene 2011 UTC Es un nombre poco frecuente Doy por hecho que son mas los errores reales que los falsos positivos y por ello abogo por dejarlo como esta Tambien incluimos formas como ultimo que un corrector convencional aceptara 1 persona singular de ultimar pero nosotros marcamos como error dado que un verbo conjugado en primera persona es muy poco frecuente y por otro lado son muchos los que olvidan el acento en ultimo Poco2 17 18 8 ene 2011 UTC Ferrari EditarCuando aparece este nombre en algun articulo el corrector lo marca como erroneo y propone como cambio cs Tal cual Es un error mio o es asi Adrgs disc contr bloq 21 59 2 feb 2011 UTC Corregido manana estara activo era un error en el listado gracias y saludos Poco2 22 16 2 feb 2011 UTC Bug EditarHola Llevo usando el corrector ademas del Twinkle y el Monobook suite lo digo por si hay algun problema de compatibilidad desde hace varios meses y hasta ahora no habia tenido ningun problema Desde hace algunos dias el Twinkle me daba algun fallo en el sentido de que no me llegaba a salir como si estuviese desactivado en algunas paginas pero se solucionaba con recargar la misma una o dos veces por lo que no le di importancia Pero desde hoy mismo el corrector ortografico tambien me falla ya que en algunos articulos me marca todas las palabras como incorrectas resalta absolutamente todas en articulos como Telecinco El problema es que en articulos un poco grandes como Telecinco me bloquea todas las pestanas de Wikipedia uso Google Chrome durante varios minutos dependiendo del tamano del articulo en Telecinco me llego a los 10 minutos llegando a consumir 300 mb de memoria RAM y usando el 80 de la CPU solo con esa pestana Se hace dificil el mantenimiento asi por lo que antes de desactivar todo me gustaria saber si a alguien mas le pasa Gracias de antemano un saludo Adriansm Dimelo a la cara 12 24 2 mar 2011 UTC Te doy un repro o sease un me pasa tambien El artilugio en estos momentos marca todas o al menos un 90 de las palabras en los articulos como erroneas y en las paginas bastante largas consigue colgar el navegador todos IE9 Safari Opera Chrome Firefox lo cual es de por si impresionante para un sistema potente como el mio de 4 nucleos Quiza pueda deberse a la transicion a la nueva version de Wiki Por ahora te recomiendo desactivarlo hasta que se solvente el problema Linfocito Salu2 desde Colo mb ia 16 36 2 mar 2011 UTC Hola Tengo el mismo bug con el corrector A ver si se arregla pronto De hecho me he fijado en que palabras pequenas como preposiciones y articulos en femenino plural no los resalta Bueno espero que pronto este arreglado Un saludo Kingpowl discusion 16 41 2 mar 2011 UTC Tilde diacritica Editar Hay alguna opinion y o consenso sobre la inclusion de palabras con tilde diacritica en esta lista Lo digo por la presencia de aun sin tilde que produce muchos falsos positivos Saludos Gons Digame 18 10 4 mar 2011 UTC Disregard hice una busqueda rapida de diacritico a pero no de aun asi que no habia leido que ya hablasteis del tema Gons Digame 18 13 4 mar 2011 UTC En realidad creo que hay un problema importante de falsos positivos la cantidad de palabras listadas donde varias opciones son correctas que hay ahora acabo de ver impulso impulso hace que esta herramienta pierda su eficacia Creo que solo se deberian listar palabras con faltas de ortografia Escarlati escribeme 11 53 17 mar 2011 UTC Que ventaja presentaria entonces esta herramienta con respecto por ejemplo al corrector del navegador no crees que terminos como ultimo que si bien si existen deberian detectarse como positivos dado que la cantidad de falsos positivos serian infima con respecto a la cantidad de errores que se detectan El termino impulso si me parece demasiado frecuente como para anadirlo en la lista de errores pero muchos otros si me parecen adecuados y precisamente ahi radica el beneficio de la herramienta Poco2 19 33 17 mar 2011 UTC Por eso hablo de terminos que son muy frecuentes como impulso que lo es bastante y estan proliferando ultimamente mucho estos terminos correctos y con una cierta frecuencia de uso hasta tal punto que yo he tenido que quitarme el corrector porque la mayor parte de los terminos que senala son en realidad correctos y entorpece la tarea de corregir ortografia en lugar de ayudar Escarlati escribeme 18 00 18 mar 2011 UTC Ok entonces estoy de acuerdo contigo De que terminos estamos hablando Poco2 18 54 18 mar 2011 UTC dd dd dd dd Segun EditarHola junio 330 a C segun el muestra seg como abreviacion de segundo y sugiere s Jeruus discusion 02 13 28 dic 2011 UTC Aqui no no entiendo porque Jeruus discusion 02 23 28 dic 2011 UTC He tratado de explicar el motivo aqui Saludos Poco2 09 21 28 dic 2011 UTC dd Fabula Fabular y derivados EditarAl parecer no reconoce el verbo Fabular y sus formas muestra un falso positivo ya que reconoce el verbo como si quisiera escribir Fabula Dark Bane Tu me diras Contribuciones 09 27 3 ene 2012 UTC Hola EditarYo es que prefiero no tocar nada que me conozco El caso es que el corrector marca como error cafe cuando esta dentro de la palabra cafeina supongo que ahora tambien lo hara P Saludetes Ensada mensajes aqui 01 40 7 feb 2012 UTC Ay que en las discus no va XD Se puede ver aqui Ensada mensajes aqui 01 42 7 feb 2012 UTC Hola Ensada Es una limitacion tecnica de los navegadores web cuando interactuan con el corrector y no puede ser solucionado puedes leerlo aqui Linfocito B Salu2 desde Colo mb ia 18 29 7 feb 2012 UTC dd Funcionamiento EditarNo se que tan complejo sea solo quiero comentar que seria util que funcione dentro del MediaWiki QuickEdit 2 4 porque generalmente cuando hay varios errores hay que abrir la pagina en una pestana y el editor en otra tambien seria muy util que las remarque dentro del editor como hace el WikiEd Esceptic0 02 39 27 jun 2012 UTC Propuesta EditarActualmente el corrector solo funciona en los articulos y anexos pero hay paginas de Wikipedia que deben estar escritas correctamente como las de tipo wikipedia Por eso propongo ampliar el campo de actuacion del corrector a Wikipedia Plantilla Ayuda Wikiproyecto Vivaelcelta discusion contribuciones 12 51 7 sep 2012 UTC A favor Y salvo que alguien me desmienta tambien en las paginas de discusion Una enciclopedia deberia estar bien escrita por completo Saludos Gons Digame 23 08 17 may 2013 UTC Otras propuestas Editar Que opinan senores y senoras Parentesis En espanol como sabran seguro se inicia dentro del parentesis con minuscula salvo donde corresponda mayuscula por la palabra en si Podriamos poner A B C y asi todo el abecedario Tambien se podria poner con los dos puntos aunque crearia mas falsos positivos porque hay mas excepcions Ordinales Como podeis ver en el enlace la forma correcta de usarlos en espanol es 1 º 2 ª 3 er y de paso N º Podriamos tambien incluirlos en la lista para sustituir 1o 2ª o No Este ultimo punto habria que asegurarse que es tecnicamente posible Quedo a la espera Saludos Gons Digame 23 06 17 may 2013 UTC A favor Ademas tambien cambiaria los puntos suspensivos que se hayan introducido con tres caracteres de punto por el solo caracter aunque seria deseable en ese caso que este caracter apareciera en la lista de caracteres especiales bajo la caja de edicion Benjavalero discusion 12 47 11 mar 2014 UTC Toolserver EditarHello everybody As you might know the Toolserver will soon die I moved the spellcheck scripts to Tool Labs So please change the script the new URL to checkArticle php is http tools wmflabs org spellcheck es checkArticle php Thank you APPER discusion 23 35 31 oct 2013 UTC Hecho Taichi 02 04 1 nov 2013 UTC Problemas EditarBuenos dias Tengo un problema en el que el corrector ortografico no funciona Tal vez sea porque el script no fue correctamente editado Gracias Tomyeze discusion 16 46 2 nov 2013 UTC Resuelto aqui tras el cambio anterior faltaba el nombre del parametro con la pagina a corregir Jose Emilio jem Tu diras 13 16 7 nov 2013 UTC No funciona EditarA dia 6 de noviembre Jakeukalane discusion 13 57 6 nov 2013 UTC Resuelto aqui tras el cambio anterior faltaba el nombre del parametro con la pagina a corregir Jose Emilio jem Tu diras 13 16 7 nov 2013 UTC Musica EditarHola se me hace que le falta resaltar la palabra musica Musica ya que la correcta es musica Musica Saludos Giliofelix responder 16 38 4 abr 2014 UTC Bueno no hace falta en el listado solo no lo esta resaltando Giliofelix responder 16 44 4 abr 2014 UTC Certificar la ortografia EditarComo se ve por la discusion el corrector automatico trae problemas porque el rojo dificulta la lectura inutilmente sobre todo en palabras comunes como aun y voces verbales del tipo ultimo ultimo dejo etc Ademas palabras escritas de manera anticuada abundan en las citas literarias hasta hace un siglo la preposicion a se escribia a menudo a etc Hay otros problemas como el del doble acento Oscar vs oscar ambos existen exegeta vs exegeta o apellidos como Perez hay quien lo escribe sin tilde o Martin vs Martin Pregunta no se podria introducir un parametro de certificacion Es decir cuando abrimos una pagina poder indicar que la propuesta de correccion es superflua Es como introducir una correccion de erratas pero marcar la palabra para que el corrector la ignore entrana un problema tecnico disponer de un caracter invisible o un formato distinto mejor si es invisible Gracias Sever Juan discusion 22 00 5 abr 2014 UTC Comentario Se trato Como enganar al corrector este tema en el Cafe hace poco Un saludo Technopat discusion 08 34 13 abr 2014 UTC Ayuda con el funcionamiento del corrector en la wikipedia en gallego EditarHola necesito un poco de ayuda para mejorar el funcionamiento de este corrector que tenemos instalado en la wikipedia en gallego pregunto aqui porque si alguien puede ayudarme un poco con la parte tecnica El caso es que en esta pagina he realizado una prueba de funcionamiento y he detectado dos cosas que no me cuadran en la lista de palabras a revisar tenemos incluido el texto la a pero en el texto de prueba que he indicado detecta La y lo marca como incorrecto pero no marca la porque en los ultimos dias parece que no hace caso a las nuevas palabras que se anaden al listado se puede comprobar en el historial la inclusion de canica y gobierno pero no se detectan en la pagina de prueba Esto tambien pasa en es wiki Si alguien entiende algo de como funciona y como debe actualizarse el corrector y puede echar un vistazo a la instalacion en gl wiki para echarnos una mano se lo agradeceria Saludos Elisardojm discusion 19 11 12 may 2014 UTC Hola Elisardojm Copio mi respuesta aqui y en gl wiki porque resultara igualmente util en ambos proyectos Para poder aclarar tus dudas he tenido que investigar el codigo del corrector en Labs e incluso hacer unas pruebas mas especificas con modificaciones de su codigo en mi propia cuenta de Labs afortunadamente el corrector esta programado en PHP mi lenguaje habitual y por eso he podido profundizar en ello Realmente ha sido interesante e instructivo averiguar o deducir las soluciones que ha buscado otro programador en algunos casos creo que mejorables pero yo tampoco me libraria de criticas si se revisara mi trabajo Antes de nada hay que explicar como funciona el corrector tratare de hacerlo sin meterme en demasiados detalles tecnicos Cuando el corrector lee el texto de la pagina a corregir y antes de contrastarlo con la lista de palabras erroneas primero hace un filtrado de todos los caracteres que no sean letras dejando espacios en su lugar llamo a esta operacion R0 y a continuacion intenta eliminar tanto las palabras de una sea R1 como de dos letras sea R2 Es decir de entrada y aunque no parece estar documentado oficialmente la intencion del programador es claramente no considerar las palabras ni de una ni de dos letras por lo que no serviria de nada que esten en el listado Ahora bien dije intenta eliminar y no elimina porque en el codigo la expresion regular usada para ejecutar R1 y R2 puede traducirse asi sustituir los bloques de texto que consten de un espacio en adelante E1 un caracter R1 dos caracteres R2 cual es quiera ya solo pueden ser letras pues R0 se hace antes y otro espacio en adelante E2 por un espacio El problema es que esos bloques se delimitan una sola vez al principio y sin solapamiento entre ellos por lo tanto cuando dos palabras de una letra aparecen consecutivamente por ejemplo en y a veces se detecta la y y se toma su E2 pero al quedar dentro de ese bloque ese espacio ya no puede funcionar como E1 para a el resultado es que a no es afectada por R1 ni eliminada Siguiendo el razonamiento si hubiera una tercera palabra de una letra consecutiva si se detectaria pero una cuarta no etc Exactamente lo mismo pasa con las series de palabras consecutivas de dos letras en R2 La alternancia entre palabras de una y dos letras no causa problema y todas son eliminadas porque primero se completa R1 y solo con el texto resultante se hace R2 formandose nuevos bloques Otra consecuencia interesante de esto es que si hay una palabra de una o dos letras exactamente al comienzo o al final del wikitexto tampoco es eliminada porque le faltaria su E1 o su E2 respectivamente lo segundo es casi imposible que suceda porque al final deberia haber categorias e incluso si hay una frase esta deberia terminar en punto que por R0 quedaria convertido en espacio y ya tendriamos el E2 Sigamos Una vez depurado el texto de entrada con esos reemplazos y otros menores que ya no vienen al caso aqui se divide el texto final palabra por palabra dividiendo por los espacios y atencion se eliminan los duplicados de la lista de palabras resultante lo cual implica que cada palabra solo aparecera una vez lo llamo A1 pero las variantes que solo cambian en el uso de mayusculas o minusculas si estaran por separado A2 ya que por defecto PHP trabaja con distincion de casos Ahora con esa lista final vamos contrastando para cada palabra si pasada a minusculas esta en la lista de errores normal o si tal cual esta en la lista de errores cs con distincion de mayusculas Si hay coincidencia se devuelve la indicacion para que esa palabra sea marcada con la correccion sugerida asociada y como es una indicacion referida simplemente a la palabra sin especificar posiciones ni contextos sera valida para cualquier aparicion de esa palabra en el wikitexto esto explica A1 ademas habra indicaciones propias para las posibles variantes con distincion de caso por A2 necesarias para que se marquen correctamente Esas indicaciones son las que llegan al navegador a traves del codigo Javascript del accesorio y hacen que aparezcan las marcas en fondo rojo Una vez explicado todo esto estamos en condiciones de analizar los casos extranos en el texto actual de tu prueba anado enlace permanente para dejar el contexto adecuado en consultas futuras la en minusculas En en la Junta el la no se elimina en R2 por ir detras de otra palabra de dos letras con lo que pasa a la comparacion con el listado como si tenemos la a en el se genera una indicacion para todos los la del texto con lo cual se marcan los otros dos la independientemente de su contexto pero no los La por A2 El segundo la que tambien va detras de en tambien habria causado por si solo que todos los la quedaran marcados pero el tercero no conforme a todo lo expuesto La en mayusculas En no en La Isla el La si se elimina en R2 por ser la tercera palabra consecutiva de dos letras conforme se ha explicado Las demas La del texto tambien se eliminan normalmente al no tener palabras de dos letras delante Por ello no pasa a la comparacion y no se genera la indicacion Y por eso los la se marcan y los La no se marcan Puedes probar a hacer cambios y veras que todos los resultados podran explicarse con lo que he dicho En cuanto a las palabras anadidas recientemente la explicacion es mas sencilla y obvia los ficheros con las listas de palabras a corregir en cada idioma se actualizaron por ultima vez el 30 de abril a las 4 h UTC cuando en teoria se actualizan a diario En es wiki no lo hemos notado porque no ha habido cambios desde entonces Imagino que se debera a algun problema en el crontab gestor de tareas programadas de Linux pero eso solo puede aclararlo el programador Y anticipandome a la siguiente pregunta soluciones Personalmente yo eliminaria al menos el R2 y tal vez el R1 ya que realmente no veo sus beneficios y si las complicaciones para hacer que funcionen siempre sin los agujeros que he explicado Asi se podrian admitir y gestionar sin problemas las palabras de dos y una letras en cualquier posicion Y ya puestos se podrian analizar otras posibles mejoras y optimizaciones me resulta particularmente sorprendente en lo negativo la duplicacion total del codigo entre idiomas que complica cualquier mantenimiento futuro Todo esto podria conseguirse preferiblemente por intervencion directa del programador previa explicacion a el de los problemas de los reemplazos y del crontab alternativamente proponiendole que me anadiera a mi como gestor de la herramienta spellcheck en Labs de forma que yo mismo podria acceder y modificar su codigo y el crontab y en ultima y muy poco deseable instancia si el programador no pudiera o no quisiera hacer nada por copiado y modificacion y ejecucion por mi mismo de la herramienta y el crontab en mi cuenta herramienta de Labs o creandome una nueva herramienta y cambiando los enlaces en nuestras Wikipedias En cualquier caso el primer paso seria contactar con el programador Ya me comentaras seguire atento al asunto Jose Emilio jem Tu diras 11 31 19 may 2014 UTC Lo primero de todo muchisimas gracias Jem por tu esfuerzo y estupendo analisis con el se aclara un poco el funcionamiento extrano que tiene algunas veces el corrector Lo que no entiendo es por que el corrector pretende ignorar las palabras de una y dos letras esto para nosotros es un problema porque hay bastantes casos en los que necesitamos realmente corregir palabras con estas longitudes Lo unico que se me ocurrre es que se salte esas palabras para mejorar el rendimiento y asi no ralentizar en exceso la carga de las paginas Pero seria interesante preguntarle al programador sobre este tema Tema a parte es que la eliminacion de esas palabras sea incorrecta si tienen que eliminarse por motivos de rendimiento tienen que eliminarse en todos los casos porque de otra forma una palabra incorrecta se detecta en unos casos y en otros no y esto provoca que se desconfie del correcto funcionamiento del programa Estoy de acuerdo contigo en que se debe contactar con el programador pero el problema es que yo no se aleman y mi ingles no llega para explicar algo que medio entiendo quien se podria encargar de tratar con el para ver si se pueden solucionar estos problemas y que arregle el crontab Saludos Elisardojm discusion 00 52 22 may 2014 UTC Aqui va una posible explicacion resumida de los problemas y soluciones en ingles que puedes retocar para dejarle al programador segun lo que hemos hablado en IRC Elisardojm Seguire al tanto de las novedades dd Hi We ve noted a couple of problems with the Spellchecker verifiquese si es el nombre oficial que le da al accesorio in eswiki and glwiki First of all the lists of words aren t being updated since April 30 perhaps there is a problem with your crontab in Labs and second the behaviour for words with one or two letters is problematic After analysing the code in Labs we ve seen that such words are supposedly being removed before the comparison with the wrong words list but in fact in the way the regex is built when a series of consecutive one or two letter words appears the even ones second fourth and so aren t removed as the first space for the regex is already used as the last space for the previous word Also as spaces are needed the words aren t removed if they are the very first thing in the wikitext or the very last but this would be almost impossible in real wikis We think it would be easier and better to just remove those replacement regexs and allow such words or at least two letter words as this is not documented there are cases of use for them in glwiki and we don t see a real performance problem there If you need help with this or the tool maintenance in general jem offers himself to help from his Labs account Thanks in advance and we wait for your answer dd Jose Emilio jem Tu diras 19 49 25 may 2014 UTC dd Ya ha respondido APPER y se ha solucionado todo muchas gracias jem Comenta que se olvido de cambiar el crontab cuando se cambio el sistema del toolserver y que ahora ya esta activo Sobre el problema de las palabras de una y dos letras comenta que ha quitado esas limitaciones para gl y es y ahora todo funciona genial Comenta ademas que si quieres te puede anadir como mantenedor de la herramienta tu diras Bueno pero esto no es todo esta era la parte urgente ahora viene la parte buena jem Ya desde hace mucho tiempo me di cuenta de que el corrector parece que no funciona en paginas de tamano medio y grandes Mira por ejemplo esta pagina en el apartado de obra deberia marcar en rojo las palabras La y otras como se puede ver en la pagina de pruebas como hace en la pagina de prueba sin embargo no se marca ninguna palabra incorrecta en todo el articulo Esto es debido a que el corrector no se activa en paginas que superan un determinado tamano por motivos de rendimiento o algo asi O quizas es porque hay demasiados errores en la pagina En la pagina de prueba he metido un error entre comentarios wiki y por la razon que sea ya no me marco ninguno Me da la impresion de que si un error se repite mas de X veces entonces ya no marca nada Saludos Elisardojm discusion 12 25 2 jun 2014 UTC dd dd Corrector ortografico y los falsos positivos EditarHola Queria preguntar si hay alguna forma de quitar el fondo rojo de la palabras que estan bien escritas creo que se denomina falsos positivos y que son correctas segun el sentido del texto o el idioma utilizado dentro de otro idioma Jesus discusion 23 09 7 feb 2016 UTC Jesus En terminos generales y por ahora no pero hay algunas formas de paliar reducir algo el problema Mas detalles en mi respuesta a Rauletemunoz unos hilos mas abajo Jose Emilio jem Tu diras 11 08 17 ago 2018 UTC Informacion obsoleta EditarParece que la informacion en Wikipedia Corrector ortografico Problemas tecnicos y limitaciones se ha quedado obsoleta No veo que el corrector marque las palabras con caracteres ASCII como segun Afortunadamente parece que la informacion sobre ese problema ya no es relevante Sugiero eliminarla del articulo yo no puedo hacerlo porque aun no estoy autoconfirmado Alonso discusion 13 04 5 may 2016 UTC Alonso El problema persiste y nunca ha desaparecido pero hay que senalar que unicamente se da en los articulos donde aparecen tanto la palabra erronea positivo correcto p ej seg como la palabra que genera el falso positivo por prolongacion de la anterior que empieza con un caracter especial p ej segun Vease el articulo Segundo Habria que mejorar la explicacion pero lo ideal seria revisar el codigo PHP en Toolforge para hacer que detecte y devuelva otro tipo de indicacion asociada a esas palabras para que el Javascript local no marque el falso positivo Es algo que planteare y probablemente abordare mas adelante Jose Emilio jem Tu diras 11 08 17 ago 2018 UTC Anadir palabra EditarAnadir palabra al corrector Palabra a corregir pins correcto pines Jcfidy discusion 05 44 3 ago 2017 UTC Anadida como puedes ver Gracias por avisar Saludos Anton Francho si me quieres decir algo 19 02 13 ago 2017 UTC Solo solo EditarCreo que ocurre lo mismo que en el caso de aun Regularmente marca como error como falso positivo las redacciones en que se usa solo de manera correcta Ej solo puede hacer referencia No se si hay accion posible al respecto Saludos GinkgoBiloba discusion 05 11 28 oct 2017 UTC No la RAE ya no reconoce la palabra solo actualmente se debe de utilizar siempre la palabra sin tilde Jcfidy discusion 08 21 28 oct 2017 UTC Error en el codigo fuente EditarMe parece se debe revisar el codigo fuente del corrector pues para el caso de la palabra capitania arroja falto positivo piensa que es capitan Ver el articulo Virreinato de Nueva Espana oSepu Discusion 20 34 20 may 2018 UTC Es decir el tilde lo esta tomando como fin de palabra oSepu Discusion 23 20 3 jun 2018 UTC Hola oSepu Es una limitacion tecnica error ya conocido que se explica aqui Solo sucede porque la palabra que genera el positivo correcto capitan sin tilde tambien aparece en el articulo concretamente en una cita de este apartado Seria bueno comprobar si en el castellano antiguo original efectivamente no hay tilde de ser asi de momento no hay solucion aunque en un futuro se podria plantear tanto omitir el contenido de las citas al procesar el texto como excluir explicitamente las palabras susceptibles de falso positivo que se detecten en el procesamiento Es algo que planteare y probablemente abordare mas adelante Jose Emilio jem Tu diras 11 08 17 ago 2018 UTC dd Pagina con muchos errores EditarBuenos dias a todos En pro del Wiktionary ingles hemos publicado una pagina que busca palabaras que nos faltan pero que puede servir tambien como fuente de errores ortograficos en es wikipedia cuentan entre los errores mas comunes rehizo pelicula despues produjo agsto posteriomente 170 veces He aqui la lista Como se ve la palabra mas comun que nos faltaba era antitanque Vamos bastante bien en en wikt en tema del idioma espanol tenemos mas de 85 000 palabras bases sin mencionar los 666 000 de paginas de conyugaciones plurales o formas de adjectivos Sin embargo siempre buscamos a mas palabras y a mas usuarios Espero que nuestra pagina os pueda servir en algo Un saludo desde en wikt Harmonicaplayer discusion 08 05 21 jun 2018 UTC Validacion de datos Editar Habria alguna manera de validar datos correctos que aparecen en sombreado rojo Es decir por poner un ejemplo en el articulo Peloton aparece el termino Company of Heroes y Heroes en rojo porque no lleva tilde No se podria poner algun tipo de codigo yo que se no se de informatica por decir algo lt Heroes gt para validar este falso positivo Creo que me he explicado peor que el Pato Donald ebrio Rauletemunoz 15 58 16 ago 2018 UTC Hola Rauletemunoz Te he entendido bien pero lo que pides no es sencillo Cualquier marca en el wikitexto del articulo podria ser confusa para los lectores y editores no avisados y ademas tendriamos que conseguir que no produjera efectos en la visualizacion normal de la pagina y con lo de lt Heroes gt por ejemplo es obvio que si hay un efecto porque los simbolos se ven Seria preferible trabajar en el codigo del corrector ya fuese en la herramienta de Toolforge o en el Javascript local o en la propia lista de errores Desde luego como primera opcion se podria anadir en el listado que Heroes es una alternativa aceptable como se hace en otros casos susceptibles de falso positivo para que al menos al pasar el puntero se sepa que puede ser correcto y seria plausible que en un futuro esos casos de varias opciones se marcaran en un color mas suave Otras opciones a evaluar podrian ser omitir casos en mayuscula a riesgo de algunos falsos negativos tambien omitir texto enlazado y enlazar en este caso porque Company of Heroes existe o introducir listas de excepciones globales de varias palabras mas complejo porque por ahora el corrector solo trabaja con palabras individuales pero no imposible Lo que si me parece impractible es introducir excepciones o como tu las llamas validaciones especificas para cada aparicion en un articulo porque con el continuo cambio e incluso eliminacion de los wikitextos no habria forma de anclar cada caso a una posicion numerica ya fuese de orden de aparicion o de numero de caracter y el mantenimiento seria inviable Todo esto esta entre las ideas que preveo plantear y abordar en un futuro junto a otros proyectos de momento esto te puedo decir aunque podemos profundizar el debate aqui o en IRC si lo deseas Saludos Jose Emilio jem Tu diras 11 08 17 ago 2018 UTC Vale a ver si lo he entendido bien jem podriamos de alguna manera decirle al corrector que no ponga en rojo palabras como fabrica establecimiento para fabricar y fabrica del verbo fabricar o al menos ponerlas mas suaves si pueden ser correctas como este ejemplo Por cierto un saludo que hace tiempo que no hablamos Rauletemunoz 22 36 18 ago 2018 UTC Si Rauletemunoz esa es una de las posibilidades que caben si se trabaja a fondo en el codigo Para ello logicamente tendriamos que ser estrictos a la hora de redactar el texto de la sugerencia tooltip para que se puedan identificar claramente los casos en que hay varias opciones ahora normalmente se separan con comas y no habria que tener en cuenta lo que pueda estar entre parentesis asi que podria bastar fijar eso como norma estricta y confiar en que los usuarios esten atentos a cumplirla Por otra parte ese cambio y todos los demas que se puedan plantear supondrian en principio separarnos del codigo original comun que en teoria esta en uso tambien en las Wikipedias en aleman gallego y persa por lo que habria que evaluar bien nuestros recursos y nuestros objetivos y quizas hablar con el autor APPER y con las respectivas comunidades Finalmente otro saludo para ti y que hablemos con mas frecuencia Jose Emilio jem Tu diras 23 00 24 ago 2018 UTC dd dd Ocupar este listado en alguna extension de Chrome EditarSaben de alguna app o extension de Chrome que pueda ocupar este listado y mostrar en las web visitadas no solo en Wikipedia los errores ortograficos seria bastante util saludos oSepu Discusion 21 10 29 sep 2020 UTC Demostrativos nunca con tilde EditarHabria que retirar del Listado del corrector ortografico todas las sugerencias de poner tilde a los demostrativos este ese aquel y sus plurales y femeninos los neutros nunca han llevado tilde cuando funcionan como pronombres Me refiero a lineas del Listado como la siguiente aquel aquel determinante y pronombre aquel pronombre Estas tildes son incorrectas de acuerdo con la Ortografia de 2010 de la Real Academia que las elimino al mismo tiempo que eliminaba la tilde de solo Vease el comienzo del apartado 3 4 3 3 de la mencionada Ortografia La palabra solo asi como los demostrativos este ese y aquel con sus femeninos y plurales funcionen como pronombres Este es tonto Quiero aquella o como determinantes aquellos tipos la chica esa son voces que no deben llevar tilde segun las reglas generales de acentuacion No obstante las reglas ortograficas venian prescribiendo el uso diacritico de la tilde en el adverbio solo y los pronombres demostrativos para distinguirlos respectivamente del adjetivo solo y de los determinantes demostrativos Sin embargo puesto que ese empleo tradicional de la tilde diacritica no opone en estos casos formas tonicas a otras atonas formalmente identicas requisito prosodico que justifica el empleo de la tilde diacritica a partir de ahora se podra prescindir de la tilde en estas formas incluso en los casos de doble interpretacion Las posibles ambiguedades son resueltas casi siempre por el propio contexto comunicativo Ortografia 2010 p 269 Convendria pues eliminar del Listado todas las lineas con demostrativos o por lo menos no sugerir que pueden llevar tilde no la pueden llevar nunca segun la Academia Rpajares discusion 17 51 24 sep 2021 UTC Obtenido de https es wikipedia org w index php title Wikipedia discusion Corrector ortografico amp oldid 138558279 Volver a la pagina de proyecto Corrector ortografico, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos