您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

PHP之验证码识别,php验证码_PHP教程

2024/4/27 12:42:07发布17次查看
php之验证码识别,php验证码
首先推荐几篇有关验证码识别的文章,觉得不错
php实现验证码的识别(初级篇)
关于bp神经网格识别验证码
一、思路
碰见一个验证码,如果我们想要识别它,我们需要的是做什么呢?
我们先观察几个验证码............
我们用人眼去观察,会很显然的认出验证码所包含的字符,那么人眼的“识别机理”是什么呢?
大概是验证码图片字符的背景的颜色区别吧,试想,如果字符和背景没有颜色区别,我们能够判断验证码吗,很显然不能。
所以,我们就可以从人出发。
先从图片的颜色着手,即图片的rgb信息。
rgb色彩模式是工业界的一种颜色标准,是通过对红(r)、绿(g)、蓝(b)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,rgb即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
定义函数取得rgb信息
1 //代码本来是一个类,现在拆开来写的,有可能有不严谨的地方,大家可以看得懂就好了 2 3 /* 4 *取得图片路径和图片尺寸 5 */ 6 $this->imagepath = $image; 7 $this->imagesize = getimagesize($image); 8 9 /*10 *获取图像标识符,保存到imageinfo,只能处理bmp,png,jpg图片11 *imagecreatefrombmp是我自己定义的函数,最后会给出12 */13 function getinfo(){14 $filetype = substr($this->imagepath,-3);15 if($filetype == 'bmp'){16 $this->imageinfo = $this->imagecreatefrombmp($this->imagepath);17 }elseif($filetype == 'jpg'){18 $this->imageinfo = imagecreatefromjpeg($this->imagepath); 19 }elseif($filetype == 'png'){20 $this->imageinfo = imagecreatefrompng($this->imagepath); 21 }22 }23 24 /*获取图片rgb信息*/25 function getrgb(){26 $rgbarray = array();27 $res = $this->imageinfo;28 $size = $this->imagesize;29 $wid = $size['0'];30 $hid = $size['1'];31 for($i=0; $i getrgb(); 8 $wid = $size['0']; 9 $hid = $size['1'];10 for($i=0; $i getgray(); 5 $wid = $size['0']; 6 $hid = $size['1']; 7 for($k=0;$k<25;$k++){ 8 echo $k.\n; 9 for($i=0; $i < $hid; ++$i){10 for($j=0; $j < $wid; ++$j){11 if($grayarray[$i][$j] getgray(); 9 $wid = $size['0'];10 $hid = $size['1'];11 for($i=0; $i < $hid; ++$i){12 for($j=0; $j <$wid; ++$j){13 if( $grayarray[$i][$j] < 90 ){14 $erzhiarray[$i][$j]=1;15 }else{16 $erzhiarray[$i][$j]=0;17 }18 }19 }20 return $erzhiarray;21 }
三、去除噪点
但是我们发现有一些小点影响了我们的判断
我们可以注意到这些事干扰噪点,但是如果我们是机器的话,我们如何判断这些点是否是字符呢?
所以接下来,我们需要将这些字符去除。
我们判断,如果一个黑点的上下左右的八个点全部是白,我们就认为它是噪点,并予以清除,赋为白
1 /* 2 *二值化图片降噪 3 *@param $erzhiarray二值化数组 4 */ 5 function reducezao($erzhiarray){ 6 $data = $erzhiarray; 7 $gao = count($erzhiarray); 8 $chang = count($erzhiarray['0']); 9 10 $jiangzaoerzhiarray = array();11 12 for($i=0;$i<$gao;$i++){13 for($j=0;$j<$chang;$j++){14 $num = 0; 15 if($data[$i][$j] == 1) 16 {17 // 上 18 if(isset($data[$i-1][$j])){ 19 $num = $num + $data[$i-1][$j]; 20 } 21 // 下 22 if(isset($data[$i+1][$j])){ 23 $num = $num + $data[$i+1][$j]; 24 } 25 // 左 26 if(isset($data[$i][$j-1])){ 27 $num = $num + $data[$i][$j-1]; 28 } 29 // 右 30 if(isset($data[$i][$j+1])){ 31 $num = $num + $data[$i][$j+1]; 32 } 33 // 上左 34 if(isset($data[$i-1][$j-1])){ 35 $num = $num + $data[$i-1][$j-1]; 36 } 37 // 上右 38 if(isset($data[$i-1][$j+1])){ 39 $num = $num + $data[$i-1][$j+1]; 40 } 41 // 下左 42 if(isset($data[$i+1][$j-1])){ 43 $num = $num + $data[$i+1][$j-1]; 44 } 45 // 下右 46 if(isset($data[$i+1][$j+1])){ 47 $num = $num + $data[$i+1][$j+1]; 48 } 49 }50 51 if($num < 1){ 52 $jiangzaoerzhiarray[$i][$j] = 0; 53 }else{54 $jiangzaoerzhiarray[$i][$j] = 1; 55 }56 }57 }58 return $jiangzaoerzhiarray; 59 60 }
我们发现噪点消失了。
四、分割
这个时候,我们就需要对单一数字字母进行操作了,我们先将数字提取出来。
有些验证码字符相连,特别难!!!
我们分别从左到右,从右到左,从上到下,从下到上,进行扫描,去除白点,找到边框。
1 /* 2 *归一化处理,针对一个个的数字,即去除字符周围的白点 3 *@param $singlearray 二值化数组 4 */ 5 function getjinsuo($singlearray){ 6 $diancount = 0; 7 $rearr = array(); 8 9 $gao = count($singlearray);10 $kuan = count($singlearray['0']);11 12 $diancount = 0;13 $shangkuang = 0;14 $xiakuang = 0;15 $zuokuang = 0;16 $youkuang = 0;17 //从上到下扫描18 for($i=0; $i -1; $i--){32 for($j=0; $j 1){38 $xiakuang = $i;39 $diancount = 0;40 break;41 }42 }43 //从左到右扫描44 for($i=0; $i -1; --$i){58 for($j=0; $j 1){64 $youkuang = $i;65 $diancount = 0;66 break;67 }68 }69 for($i=0;$i<$xiakuang-$shangkuang+1;$i++){70 for($j=0;$j<$youkuang-$zuokuang+1;$j++){71 $rearr[$i][$j] = $singlearray[$shangkuang+$i][$zuokuang+$j];72 }73 }74 return $rearr;75 }
然后从左到右扫描,找到字符的分割
返回三维数组,每一维就是一个字符。
1 /* 2 *切割成三维数组,每个小数字在一个数组里面 3 *只适用四个数字一起的数组 4 *@param 经过归一化处理的二值化数组 5 */ 6 function cutsmall($erzhiarray){ 7 $doublearray = array(); 8 $jiezouyou = array(); 9 10 $gao = count($erzhiarray);11 $kuan = count($erzhiarray['0']);12 13 $jie = 0;14 $s = 0;15 $jiezouyou[$s] = 0;16 $s++;17 //从左到右扫描18 19 for($i=0; $i < $kuan;){20 for($j=0; $j < $gao; ++$j){21 $jie = $jie + $erzhiarray[$j][$i];22 }23 //如果有一列全部是白,设置$jiezouyou,并且跳过中间空白部分24 if($jie == 0){25 $jiezouyou[$s] = $i+1;26 do{27 $n = ++$i;28 $qian = 0;29 $hou = 0;30 for($m=0; $m < $gao; ++$m){31 $qian = $qian + $erzhiarray[$m][$n];32 $hou = $hou + $erzhiarray[$m][$n+1]; 33 }34 $jiezouyou[$s+1] = $n+1;35 }36 //当有两列同时全部为白,说明有间隙,循环,知道间隙没有了37 while($qian == 0 && $hou == 0);38 $s+=2;39 $i++;40 }else{41 $i++; 42 }43 44 $jie = 0;45 }46 $jiezouyou[] = $kuan;47 //极端节点数量,(应该是字符个数)*248 $jiezouyoucount = count($jiezouyou);49 50 for($k=0;$k<$jiezouyoucount/2;$k++){51 for($i=0; $i 大脑传递扭转角度时刻在发生,最后图片就“正”过来了。
人是怎么观察“倾斜”的,以上面的“2”做例子,可能是右上方(左下方)的黑色比左上方(右下方)的多?
我们建立x轴正向向下,y轴向右的直角坐标系
我们计算每一层的黑点的分布中点坐标,得到一系列离散点,计算这些点所在的直线(线性回归方程的计算,),公式y = b*x+a,
竟然有用到这个公式的一天!!!
大概就是一条倾斜的直线了,通过直线计算直线倾斜角度,然后转这么多的角度,图片应该就“正”了吧。
其中a,b的计算如下
1 /* 2 *定义求线性回归a和b的函数 3 *@param $zuobiaoarray坐标的三维数组 4 */ 5 function gethuigui($zuobiaoarray){ 6 $y8 = 0; 7 $x8 = 0; 8 $x2 = 0; 9 $xy = 0;10 $geshu = count($zuobiaoarray);11 for($i=0;$i0){10 $xianjiao = m_pi/2;11 }elseif($y<0){12 $xianjiao = -m_pi/2;13 }else{14 $p['x'] = 0;15 $p['y'] = 0;16 return $p;17 }18 }else{19 $xianjiao = atan($y/$x); 20 }21 $jiao =$xianjiao-atan($b);22 $chang = sqrt($x*$x+$y*$y);23 $p['x'] = $chang*cos($jiao);24 $p['y'] = $chang*sin($jiao);25 return $p;26 }
转角吧
1 /* 2 *对【单个】数字的二值化二维数组进行倾斜调整 3 *@param $singlearray 高*宽的二值数组(0,1) 4 */ 5 function singleslopeadjust($singleerzhiarray){ 6 $slopearray = array(); 7 $gao = count($singleerzhiarray); 8 $chang = count($singleerzhiarray['0']); 9 10 //初始化$slopearray11 for($i=0;$i<$gao*4;$i++){12 for($j=0;$j<$chang*4;$j++){13 $slopearray[$i][$j] = 0;14 }15 }16 17 //初始化中心坐标(是数组的下标)18 $centerxfoalt = ($gao-1)/2;19 $centeryfoalt = ($chang-1)/2;20 $centerx = ceil($centerxfoalt);21 $centery = ceil($centeryfoalt);22 23 //初始化图片倾斜诶角度24 /*斜率的计算!!!!!,回归方程*/25 //从上到下扫描,计算中点,求得一串坐标($i,$ava)26 for($i=0;$i<$gao;$i++){27 $num = 0;28 $amount = 0;29 for($j=0;$j<$chang;$j++){30 if($singleerzhiarray[$i][$j] == 1){31 $num = $num+$j;32 $amount++;33 }34 }35 if($amount == 0){36 $ava[$i] = $chang/2; 37 }else{38 $ava[$i] = $num/$amount;39 }40 }41 42 43 //计算线性回归方程的b与a44 $zuo = array();45 for($j=0;$jgethuigui($zuo);50 $zuob = $res['b'];51 52 53 for($i=0;$igetjinsuo($slopearray);66 return $slopearray;67 }
看到正了一些
六、统一大小
上文中因为各种操作,每个字符大小不一,我们需要统一大小
七、特征值的建立
有很多方法
1、逐像素特征提取法
这是一种最简单的特征提取方法。它可以对图像进行逐行逐列的扫描,当遇到黑色像素时取其特征值为1,遇到白色像素时取其特征值为0,这样当扫描结束后就获得一个维数与图像中的像素点的个数相同的特征向量矩阵。
这种方法提取的信息量最大,但是它的缺点也很明显,就是适应性不强。
2、骨架特征提取法
两幅图像由于它们的线条的粗细不同,使得两幅图像差别很大,但是将它们的线条进行细化后,统一到相同的宽度,如一个像素宽时,这是两幅图像的差距就不那么明显。利用图形的骨架作为特征来进行数码识别,就使得识别有了一定的适应性。一般使用细化的方法来提取骨架,细化的算法有很多,如hilditch算法、rosenfeld算法等。对经过细化的图像利用everypixel函数进行处理就可以得到细化后图像的特征向量矩阵。骨架特征提取的方法对于线条粗细不同的数码有一定的适应性,但是图像一旦出现偏移就难以识别。
3、微结构法
微结构法将图像分为几个小块,统计每个小块的像素分布。本文提取出汉字的39个特征,存储在数组f[0]~f[38]中。具体算法可分为四步:
步骤一:把字符平均分成9份,如图4.1所示,给每一份编号如图4.2,统计每一份内黑色像素的个数,存储在数字tz[0]~tz[9]中,统计在行方向和列方向上每一份内的黑色像素个数和与之相邻的一份内黑色像素个数的比值作为一个特征,例如:行方向上提取特征f[0]=tz[1]/ tz[0],f[1]=tz[2]/ tz[1],f[2]=tz[0]/ tz[2],…,f[8]=tz[6]/ tz[8];列方向上f[9]=tz[3]/ tz[0],f[10]=tz[6]/ tz[3],f[11]=tz[0]/ tz[6],…,f[17]=tz[2]/ tz[8],共18个特征。
步骤二:把字符横向分成三份,如图4.3所示,统计每一份内的黑色像素个数,每一份内的黑色像素个数与前一份内黑色像素个数的比值作为一个特征,f[18]=tz[10]/ tz[9],f[19]=tz[11]/ tz[10],f[20]=tz[9]/ tz[11];把字符纵向分成三份,如图4.4所示,统计每一份内的黑色像素个数,每一份内的黑色像素个数与前一份内黑色像素个数的比值作为一个特征,f[21]=tz[13]/ tz[12],f[22]=tz[14]/ tz[13],f[23]=tz[12]/ tz[14];共六个特征。
步骤三:如图4.5,在竖直方向上找出三列,统计在该列中跳变点的个数,即相邻点像素值从0变到255的次数,共三个特征,记为f[24],f[25],f[26];在水平方向上找出三行列,统计在该行中跳变点的个数,即相邻点象素值从0变到255的次数,共三个特征,记为f[27],f[28],f[29]。
图4.5
步骤四:把每一份内黑色象素的个数tz[0]~tz[9],作为9个特征,记为:f[30]~f[38]。
这样得到汉字的共39个特征,根据这些特征就可以区分每个车牌汉字,进行识别。
我们使用最简单的逐像素特征提取法。
多多增加数据库,识别率会增加的
八、识别验证码
对于一个新的验证码,进行上文操作,然后对比数据库就可以了
1 /* 2 *进行匹配 3 *@param $image 图片路径 4 */ 5 public function run($image){ 6 $data = array('','','',''); 7 $result=; 8 $bilu = ''; 9 $maxarr = '';10 11 //提取特征12 $this->prepare($image);13 $yuanshi = $this->geterzhi();14 $yijijiangzao = $this->reducezao($yuanshi);15 $small = $this->cutsmall($yijijiangzao);16 for($k=0;$ktianchong($small[$k]);18 $tiaozhenjiaodu = $this->singleslopeadjust($tianchong);19 $tongyidaxiao = $this->tongyidaxiao($tiaozhenjiaodu);20 for($i=0;$ikeys as $value => $key)34 {35 similar_text($value, $numstring,$percent);36 if($percent > $max)37 {38 $max = $percent;39 $num = $key;40 $zim = $value;41 }42 if($max>95){43 break;44 }45 }46 $result .=$num;47 $maxarr[] = $max;48 }49 // 查找最佳匹配数字50 $re = $maxarr;51 $re[] = $result;52 return $re;53 //return $result.'|max|一:'.$maxarr['0'].'|二:'.$maxarr['1'].'|三:'.$maxarr['2'].'|四:'.$maxarr['3'];54 }
试试:
php图形验证码识别
>
php 验证码识别 或者asp程序也行怎写程序识别
原理不难,只需通过php来生成一张图片!在这张图片上通过php的图片处理函数在图片上写几个字符就ok啦!在写字符时注意将写的字符记录下,这个记录是通过session来做!然后在验证时直接调用$_session变量就可以了!
具体的代码如下:
有两个文件
yangzhengma.php用来显示图片和验证输入的验证码
验证码实例
请输入验证码:
注意图片的地址写到php生成图片的文件地址
check.php用来生成图片
>
http://www.bkjia.com/phpjc/857272.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/857272.htmltecharticlephp之验证码识别,php验证码 首先推荐几篇有关验证码识别的文章,觉得不错 php实现验证码的识别(初级篇) 关于bp神经网格识别验证码 一、思...
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product