Yo se que esto es muy conocido (http://www.debasish.in/2012/01/bypass-captcha-using-python-and.html), solo quería tenerlo a la mano cuando me digan (otra vez): "Haz visto el captcha de XXX?, porque no usamos ese?".
Aqui el captcha:
Seguro ya lo han visto en una pagina muy visitada y que nos da dolores de cabeza cada mes.
Hipotesis: "a poner eso, mejor no pongo nada"
#!/usr/bin/pythonfrom PIL import Image
import os, sys
import ImageEnhance
#im_name = raw_input('Archivo :')
im_name = sys.argv[1]
im = Image.open(im_name)
im = im.convert("L")
contr = ImageEnhance.Contrast(im)
im = contr.enhance(2)
im.save("temp.gif", "GIF")
original = Image.open('temp.gif')
bg = original.resize((original.size[0] * 3, original.size[1] * 3), Image.BICUBIC)
bg.save("temp2.gif", "GIF")
os.system("tesseract temp2.gif output-ocr > /dev/null 2>&1")
foutput = open('output-ocr.txt', 'r')
text = foutput.readline().rstrip()
foutput.close()
print im_name
print text
Probándolo:
$ ./bartola.py captcha3.jpeg
captcha3.jpeg
MUBR
captcha3.jpeg
MUBR
Se que el script se puede mejorar mucho más para tener un porcentaje mayor de acierto (este script solo tiene el 30%), por ahora es suficiente para demostrar el punto.
Yo se que hay todo un tema de funcionalidad, y no pretendo discutir eso. Solo que si van a poner uno asi, mejor no pongan nada.
No mi amoooooooooooor...
No hay comentarios:
Publicar un comentario