Home Tecnología Probé ‘humanizantes’ para ver qué tan bien realmente disfrazan la escritura de...

Probé ‘humanizantes’ para ver qué tan bien realmente disfrazan la escritura de AI

40
0

La inteligencia artificial (IA) no puede hacer todo (o al menos no puede hacer todo bien), pero una cosa en las que las herramientas generativas de IA que usan modelos de lenguaje grandes son muy buenas es crear texto. Si bombardeabas la parte verbal de la prueba SAT y escribir algo más tiempo que un texto es aterrador, toda la experiencia puede parecer bastante mágica; Poder generar un correo electrónico, ensayo o carta de presentación sin tener que mirar una página en blanco durante horas y preocuparse por cada elección de vocabulario es una herramienta poderosa. Por eso se estima que Casi el 20% de los adultos en los Estados Unidos Hemos usado AI para escribir correos electrónicos o ensayos.

Una vez que ese correo electrónico o ensayo se pule (y se verifica los hechos, ¿verdad?), Sin embargo, hay un obstáculo inminente: detectores de IA, que van desde los humanos al tanto de los “dientes” detrás de la escritura generada por IA hasta las herramientas en línea que pretenden escanear el texto e identificar si fue escrito por seres humanos o AI. La precisión de esos detectores es cuestionable, pero la gente los usa, por lo que debe preocuparse por eso si va a pasar una carta de presentación generada por IA u otra pieza de escritura como algo no escrito por AI.

Ingrese el “humanizador” de IA, una herramienta diseñada para tomar su copia de IA y convertirla en algo, bueno, más humano eliminando y reformulando ai -tics y frases comunes. Es una idea atractiva: obtienes AI para generar tu ensayo, lo pasas a través del humanizador y el resultado final parece que fue escrito desde cero por un humano (presumiblemente, tú). ¿Pero funcionan?

La prueba

Para averiguarlo, realicé un pequeño experimento. Si bien esta no es exactamente una investigación exhaustiva, definitivamente me dio una sensación sólida de si vale la pena usar alguna de estas herramientas si insiste en que AI escriba en secreto toda su correspondencia, tareas escolares o correos electrónicos sinceros a viejos amigos.

Primero, tuve el chatgpt generando un ensayo sobre … cómo hacer que la escritura de IA sea más humanizada. Dirigió un ensayo en unos segundos, y el resultado fue perfectamente coherente. No lo verifiqué o masajeé el texto de ninguna manera; Su único propósito es probarse en herramientas de humanización.

A continuación, ejecuté el ensayo a través de algunos detectores de IA para asegurarme de que fuera un buen ejemplo de escritura mediocre de IA. Los resultados fueron como se esperaba: Quillbot lo calificó como 94% AI, Zerogpt lo obtuvo en 97% y CopyLeaks lo obtuvo un robusto 100% generado por IA. El mundo de los detectores de IA estuvo de acuerdo: este ensayo de ChatGPT se lee como si fue escrito por ChatGPT.

Los resultados

Ahora, ¿podrían las herramientas de humanizador de IA arreglar eso? Hay muchos humanizadores por ahí: la explosión de los chatbots de IA ha inspirado una guerra entre los detectores y las herramientas diseñadas para engañarlos. Así que elegí algunos populares para probar.

Primero, sin embargo, quería un poco más de calibración, así que hice algo obvio: volví al texto de Chatgpt y le pedí que humanizara el texto. Después de todo, todas estas herramientas están basadas en la IA, por lo que quizás lo más fácil del mundo sea pedirle a ChatGPT que se parezca menos a sí mismo.

¿Qué piensas hasta ahora?

Luego tomé el texto original generado por ChatGPT y lo alimenté a través de otras cuatro herramientas de humanizador: Parafraser.io, Sigiloso, Gramáticay Gtumano.

Ahora tenía cinco versiones “humanizadas” de un ensayo que tres detectores de IA habían anotado como obviamente AI. ¿Mejorarían sus puntajes? La respuesta es casi no, aunque una herramienta mostró lo que podría llamar generosamente “promesa”:

Parafraser.io: Fue asesinado. Quillbot obtuvo su versión al 83%generado por IA, copyleks a un 100%bastante firme y Zerogpt a un 99.94%sospechosamente específico.

CHATGPT: Bombado, aunque para ser justos, no es específicamente un humanizador, y tal vez un aviso más minucioso habría arrojado mejores resultados. Tanto Quillbot como CopyLeaks lo obtuvieron al 100% de Generación de IA, mientras que Zerogpt le dio 87.77%.

Grammarly: también bombardeó bastante a fondo, con Quillbot, CopyLeaks y Zerogpt puntuando su versión 99%, 97.1%y 99.97%respectivamente.

GPTHUMAN: Este tuvo resultados mixtos. Quillbot fue totalmente engañado, anotándolo al 0% de Generación de Ai, y Zerogpt no estaba seguro de sí mismo, lo que lo anotó solo 60.96%. Pero CopyLeaks no tenía dudas, abofeteando con un puntaje del 100%.

Stealthwriter: el más efectivo probado aquí. Mientras Zerogpt era sospechoso, lo anotó como (nuevamente, curiosamente específico) 64.89% de genes de IA, CopyLeaks lo obtuvo en solo un 3%, y Quillbot fue totalmente engañado con un puntaje del 0%.

Un aspecto de la escritora sigilosa que pudo haber ayudado a su efectividad fue la capacidad de seguir pasando el humanizador sobre el texto una y otra vez. La primera carrera, el sigiloso, afirmó que obtendría un puntaje de 65% humano, así que lo corrí por segunda vez, y el puntaje saltó a los 80, así que lo volví a ejecutar, y alcanzó el 95%. Después de eso, el puntaje no se movió cuando ejecuté la herramienta Humanizer sobre el texto.

Todas estas herramientas indican con bastante claridad que debe revisar los resultados y hacer sus propios ajustes, y no revisé el texto humanizado para la calidad de la escritura o la precisión. Solo quería ver si engañarían a los detectores de IA, y la respuesta es: probablemente no, pero el escritor sigiloso podría ayudar.

Finalmente, considere que hay muchas herramientas de detector de IA, lo que significa que la variabilidad de los puntajes (incluso con el escritor sigiloso) es una preocupación: no siempre puede saber qué herramienta de detector está utilizando alguien. Si están usando un detector que no usé aquí y es mejor para detectar lo que está haciendo StealthWriter, por ejemplo, aún se lo clavan. Si le preocupa que su texto generado por IA se detecte como tal, su mejor apuesta sigue siendo escribiendo usted mismo, o al menos revisar el texto generado por IA muy, muy a fondo.

Fuente de noticias