开源混淆工具ProGuard配置详解及配置实例

Posted on

开源混淆工具ProGuard配置详解及配置实例

开源混淆工具ProGuard配置详解及配置实例

ProGuard是一个免费的java类文件压缩,优化,混淆器.它探测并删除没有使用的类,字段,方法和属性.它删除没有用的说明并使用字节码得到最大优化.它使用无意义的名字来重命名类,字段和方法.

ProGuard的作用:

1.创建紧凑的代码文档是为了更快的网络传输,快速装载和更小的内存占用. 2.创建的程序和程序库很难使用反向工程. 3.所以它能删除来自源文件中的没有调用的代码 4.充分利用java6的快速加载的优点来提前检测和返回java6中存在的类文件.

参数:

-include {filename} 从给定的文件中读取配置参数 -basedirectory {directoryname} 指定基础目录为以后相对的档案名称 -injars {class_path} 指定要处理的应用程序jar,war,ear和目录 -outjars {class_path} 指定处理完后要输出的jar,war,ear和目录的名称 -libraryjars {classpath} 指定要处理的应用程序jar,war,ear和目录所需要的程序库文件 -dontskipnonpubliclibraryclasses 指定不去忽略非公共的库类。 -dontskipnonpubliclibraryclassmembers 指定不去忽略包可见的库类的成员。 保留选项 -keep {Modifier} {class_specification} 保护指定的类文件和类的成员 -keepclassmembers {modifier} {class_specification} 保护指定类的成员,如果此类受到保护他们会保护的更好 -keepclasseswithmembers {class_specification} 保护指定的类和类的成员,但条件是所有指定的类和类成员是要存在。 -keepnames {class_specification} 保护指定的类和类的成员的名称(如果他们不会压缩步骤中删除) -keepclassmembernames {class_specification} 保护指定的类的成员的名称(如果他们不会压缩步骤中删除) -keepclasseswithmembernames {class_specification} 保护指定的类和类的成员的名称,如果所有指定的类成员出席(在压缩步骤之后) -printseeds {filename} 列出类和类的成员-keep选项的清单,标准输出到给定的文件

压缩 -dontshrink 不压缩输入的类文件 -printusage {filename} -whyareyoukeeping {class_specification}

优化 -dontoptimize 不优化输入的类文件 -assumenosideeffects {class_specification} 优化时假设指定的方法,没有任何副作用 -allowaccessmodification 优化时允许访问并修改有修饰符的类和类的成员

混淆 -dontobfuscate 不混淆输入的类文件 -printmapping {filename} -applymapping {filename} 重用映射增加混淆 -obfuscationdictionary {filename} 使用给定文件中的关键字作为要混淆方法的名称 -overloadaggressively 混淆时应用侵入式重载 -useuniqueclassmembernames 确定统一的混淆类的成员名称来增加混淆 -flattenpackagehierarchy {package_name} 重新包装所有重命名的包并放在给定的单一包中 -repackageclass {package_name} 重新包装所有重命名的类文件中放在给定的单一包中 -dontusemixedcaseclassnames 混淆时不会产生形形色色的类名 -keepattributes {attribute_name,...} 保护给定的可选属性,例如LineNumberTable, LocalVariableTable, SourceFile, Deprecated, Synthetic, Signature, and InnerClasses. -renamesourcefileattribute {string} 设置源文件中给定的字符串常量 Ant Example:

-injars in.jar -outjars out.jar -libraryjars ${java.home}/lib/rt.jar -printmapping out.map -renamesourcefileattribute SourceFile -keepattributes SourceFile,LineNumberTable -keepattributes /Annotation/ -keepclasseswithmembers public class / { public static void main(java.lang.String[]); } -keepclasseswithmembernames class / { native <methods>; } -keepclassmembers class / extends java.lang.Enum { public static //[] values(); public static // valueOf(java.lang.String); } -keepclassmembers class / implements java.io.Serializable { static final long serialVersionUID; static final java.io.ObjectStreamField[] serialPersistentFields; private void writeObject(java.io.ObjectOutputStream); private void readObject(java.io.ObjectInputStream); java.lang.Object writeReplace(); java.lang.Object readResolve(); } 来源: [http://www.kaiyuanba.cn/html/1/131/138/7820.htm](http://www.kaiyuanba.cn/html/1/131/138/7820.htm)

Android 2.3 代码混淆proguard技术介绍

Posted on

Android 2.3 代码混淆proguard技术介绍

Android 2.3 代码混淆proguard技术介绍

由于各种反编译工具的泛滥,作为Android程序员在2.3版本以前只能通过手动添加proguard来实现代码混淆

proguard这个工具是一个java代码混淆的工具

在2.3版本的sdk中 我们可以看到在android-sdk-windows/tools/下面多了一个proguard文件夹

google已经把proguard技术放在了android sdk里面 可以通过正常的编译方式也能实现代码混淆了

可以看见新建一个工程里面有default.properties和proguard.cfg

默认的default.properties代码如下

[c-sharp] view plaincopy

  1. /# This file is automatically generated by Android Tools.
  2. /# Do not modify this file -- YOUR CHANGES WILL BE ERASED!
  3. /#
  4. /# This file must be checked in Version Control Systems.
  5. /#
  6. /# To customize properties used by the Ant build system use,
  7. /# "build.properties", and override values to adapt the script to your
  8. /# project structure.
  9. /# Project target.
  10. target=android-9

我们可以看到proguard.cfg已经帮我们写好了优化代码脚本

[c-sharp] view plaincopy

  1. -optimizationpasses 5
  2. -dontusemixedcaseclassnames
  3. -dontskipnonpubliclibraryclasses
  4. -dontpreverify
  5. -verbose
  6. -optimizations !code/simplification/arithmetic,!field//,!class/merging//
  7. -keep public class /* extends android.app.Activity
  8. -keep public class /* extends android.app.Application
  9. -keep public class /* extends android.app.Service
  10. -keep public class /* extends android.content.BroadcastReceiver
  11. -keep public class /* extends android.content.ContentProvider
  12. -keep public class com.android.vending.licensing.ILicensingService
  13. -keepclasseswithmembernames class /* {
  14. native ;
  15. }
  16. -keepclasseswithmembernames class /* {
  17. public (android.content.Context, android.util.AttributeSet);
  18. }
  19. -keepclasseswithmembernames class /* {
  20. public (android.content.Context, android.util.AttributeSet, int);
  21. }
  22. -keepclassmembers enum /* {
  23. public static //[] values();
  24. public static // valueOf(java.lang.String);
  25. }
  26. -keep class /* implements android.os.Parcelable {
  27. public static final android.os.Parcelable$Creator /*;
  28. }

从脚本中可以看到,混淆中保留了继承自Activity、Service、Application、BroadcastReceiver、ContentProvider等基本组件以及com.android.vending.licensing.ILicensingService

并保留了所有的Native变量名及类名,所有类中部分以设定了固定参数格式的构造函数,枚举等等。(详细信息请参考/examples中的例子及注释。)

接下来 按照google帮助文档里说的

[c-sharp] view plaincopy

  1. To enable ProGuard so that it runs as part of an Ant or Eclipse build, set the proguard.config property in the /default.properties file. The path can be an absolute path or a path relative to the project's root.

所以我们修改default.properties file

加上一句

proguard.config=proguard.cfg

如下

[c-sharp] view plaincopy

  1. /# This file is automatically generated by Android Tools.
  2. /# Do not modify this file -- YOUR CHANGES WILL BE ERASED!
  3. /#
  4. /# This file must be checked in Version Control Systems.
  5. /#
  6. /# To customize properties used by the Ant build system use,
  7. /# "build.properties", and override values to adapt the script to your
  8. /# project structure.
  9. /# Project target.
  10. target=android-9
  11. proguard.config=proguard.cfg

然后正常的编译签名即可

然后用Android Tools生成一个发布的apk即可

然后用反编译工具查看dex文件

最后导出反编译之后的混淆代码如下图

是不是很轻松加愉快!希望各位程序员都能保护好自己的Android代码! 来源: [http://blog.csdn.net/Zengyangtech/article/details/6127600](http://blog.csdn.net/Zengyangtech/article/details/6127600)

13_7_5 key可以重复的Map集合:IdentityHashMap

Posted on

13_7_5 key可以重复的Map集合:IdentityHashMap

51CTO首页 | 新闻 | 专题 | 论坛 | 博客 | 技术圈 | 读书 | 技术频道| CIO| 存储| 地图 | English

13.7.5 key可以重复的Map集合:IdentityHashMap

http://book.51cto.com/ 2009-08-03 09:31 李兴华 清华大学出版社 我要评论(0)

  • 摘要:《Java开发实战经典》第13章Java类集,本章将对Java类集进行完整的介绍,针对于一些较为常用的操作也将进行深入的讲解。本节为大家介绍key可以重复的Map集合:IdentityHashMap。
  • 标签:IdentityHashMap Java Java开发实战经典 *

13.7.5 key可以重复的Map集合:IdentityHashMap

之前所讲解的所有Map操作中key的值是不能重复的,例如,HashMap操作时key是不能重复的,如果重复则肯定会覆盖之前的内容,如下代码所示。

范例:Map中的key不允许重复,重复就是覆盖

  1. package org.lxh.demo13.mapdemo;
  2. import java.util.HashMap;
  3. import java.util.Iterator;
  4. import java.util.Map;
  5. import java.util.Set;
  6. class Person {
    // 定义Person类
  7. private String name;
    // 定义name属性
  8. private int age;
    // 定义age属性
  9. public Person(String name, int age) {
    // 通过构造方法为属性赋值
  10. this.name = name;
    // 为name属性赋值
  11. this.age = age;
    // 为age属性赋值
  12. }
  13. public boolean equals(Object obj) {
    // 覆写equals()方法
  14. if (this == obj) {
    // 判断地址是否相等
  15. return true;
    // 返回true表示同一对象
  16. }
  17. if (!(obj instanceof Person)) {
    // 传递进来的不是本类的对象
  18. return false;
    // 返回false表示不是同一对象
  19. }
  20. Person p = (Person) obj;
    // 进行向下转型
  21. if (this.name.equals(p.name) && this.age == p.age) {
  22. return true ;
    // 属性依次比较,相等返回true
  23. }else{
  24. return false ;
    // 属性内容不相等,返回false
  25. }
  26. }
  27. public int hashCode(){
    // 覆写hashCode()方法
  28. return this.name.hashCode() /* this.age ;
    // 计算公式
  29. }
  30. public String toString() {
    // 覆写toString()方法
  31. return "姓名:" + this.name + ";年龄:"
  • this.age; // 返回信息
  1. }
  2. }
  3. public class IdentityHashMapDemo01 {
  4. public static void main(String[] args) {
  5. Map map = null;
    // 声明Map对象,指定
  6. 泛型类型
  7. map = new HashMap();
    // 实例化Map对象
  8. map.put(new Person("张三", 30), "zhangsan_1");
    // 增加内容
  9. map.put(new Person("张三", 30), "zhangsan_2");
    // 增加内容,key重复
  10. map.put(new Person("李四", 31), "lisi");
    // 增加内容
  11. Set> allSet = null;
    // 声明一个Set集合
  12. allSet = map.entrySet();
    // 将Map接口实例变为
  13. Set接口实例
  14. Iterator> iter = null; // 声明Iterator
  15. 对象
  16. iter = allSet.iterator();
    // 实例化Iterator
  17. 对象
  18. while (iter.hasNext()) {
    // 迭代输出
  19. Map.Entry me = iter.next();// 每个对象都是Map.
  20. Entry实例
  21. System.out.println(me.getKey()
    • " --> " + me.getValue());
      // 输出key和value
  22. }
  23. }
  24. }

程序运行结果:

  1. 姓名:李四;年龄:31 --> lisi
  2. 姓名:张三;年龄:30 --> zhangsan_2

从程序的运行结果中可以发现,第二个内容覆盖了第一个内容,所以此时可以使用Identity HashMap。使用此类时只要地址不相等(key1!=key2),就表示不是重复的key,可以添加到集合中。

范例:使用IdentityHashMap修改程序

  1. package org.lxh.demo13.mapdemo;
  2. import java.util.IdentityHashMap;
  3. import java.util.Iterator;
  4. import java.util.Map;
  5. import java.util.Set;
  6. class Person {
  7. // 此类与之前定义一样,此处不再列出
  8. }
  9. public class IdentityHashMapDemo02 {
  10. public static void main(String[] args) {
  11. Map map = null;
    // 声明Map对象,指定
  12. 泛型类型
  13. map = new IdentityHashMap(); // 实例化Map对象
  14. map.put(new Person("张三", 30), "zhangsan_1"); // 增加内容
  15. map.put(new Person("张三", 30), "zhangsan_2");
    // 增加内容,key重复
  16. map.put(new Person("李四", 31), "lisi");
    // 增加内容
  17. Set> allSet = null; // 声明一个Set集合
  18. allSet = map.entrySet();
    // 将Map接口实例变为
  19. Set接口实例
  20. Iterator> iter = null;// 声明Iterator对象
  21. iter = allSet.iterator();
    // 实例化Iterator
  22. 对象
  23. while (iter.hasNext()) {
    // 迭代输出
  24. Map.Entry me = iter.next();// 每个对象都是Map.
  25. Entry实例
  26. System.out.println(me.getKey()
    • " --> " + me.getValue());
      // 输出key和value
  27. }
  28. }
  29. }

程序运行结果:

  1. 姓名:张三;年龄:30 --> zhangsan_2
  2. 姓名:张三;年龄:30 --> zhangsan_1
  3. 姓名:李四;年龄:31 --> lisi

从程序的运行结果中可以发现,现在的key允许重复,只要两个对象的地址不相等即可。

【责任编辑:云霞 TEL:(010)68476606】 回书目 上一节 下一节 上一篇: 13.7.4 Map接口的使用注意事项(2) 下一篇: 13.8 SortedMap接口

频道推荐

更多>>

刀片服务器 云计算 ARP攻防 思科培训

全站热点

更多>>

ARP攻击防范与..

2009年下半年..

技术人

更多>>

IT十大死对头:L..

程序员面试技巧..

更多>>

更多>>

最新热帖

更多>>

Copyright©2005-2009 51CTO.COM 版权所有

说说IO(三)

Posted on

说说IO(三)- IO性能的重要指标

最重要的三个指标

IOPS

IOPS,即每秒钟处理的IO请求数量。IOPS是随机访问类型业务(OLTP类)很重要的一个参考指标。

  • 一块物理硬盘能提供多少IOPS**?**

从磁盘上进行数据读取时,比较重要的几个时间是:寻址时间(找到数据块的起始位置),旋转时间(等待磁盘旋转到数据块的起始位置),传输时间(读取数据的时间和返回的时间)。其中寻址时间是固定的(磁头定位到数据的存储的扇区即可),旋转时间受磁盘转速的影响,传输时间受数据量大小的影响和接口类型的影响(不用硬盘接口速度不同),但是在随机访问类业务中,他的时间也很少。因此,在硬盘接口相同的情况下,IOPS主要受限于寻址时间和传输时间。以一个15K的硬盘为例,寻址时间固定为4ms,传输时间为60s/15000/*1/2=2ms,忽略传输时间。1000ms/6ms=167个IOPS。

  • OS**的一次IO请求对应物理硬盘一个IO吗?**

在没有文件系统、没有VM(卷管理)、没有RAID、没有存储设备的情况下,这个答案还是成立的。但是当这么多中间层加进去以后,这个答案就不是这样了。物理硬盘提供的IO是有限的,也是整个IO系统存在瓶颈的最大根源。所以,如果一块硬盘不能提供,那么多块在一起并行处理,这不就行了吗?确实是这样的。可以看到,越是高端的存储设备的**cache越大,硬盘越多,一方面通过cache异步处理IO,另一方面通过盘数增加,尽可能把一个OS的IO**分布到不同硬盘上,从而提高性能。文件系统则是在cache上会影响,而VM则可能是一个IO分布到多个不同设备上(Striping)。

所以,一个**OS的IO在经过多个中间层以后,发生在物理磁盘上的IO**是不确定的。可能是一对一个,也可能一个对应多个

  • IOPS**能算出来吗?**

对单块磁盘的IOPS的计算没有没问题,但是当系统后面接的是一个存储系统时、考虑不同读写比例,IOPS则很难计算,而需要根据实际情况进行测试。主要的因素有:

  • 存储系统本身有自己的缓存。缓存大小直接影响IOPS,理论上说,缓存越大能cache的东西越多,在cache命中率保持的情况下,IOPS会越高。
  • RAID**级别**。不同的RAID级别影响了物理IO的效率。
  • 读写混合比例。对读操作,一般只要cache能足够大,可以大大减少物理IO,而都在cache中进行;对写操作,不论cache有多大,最终的写还是会落到磁盘上。因此,100%写的IOPS要越狱小于100%的读的IOPS。同时,100%写的IOPS大致等同于存储设备能提供的物理的IOPS。
  • 一次IO**请求数据量的多少**。一次读写1KB和一次读写1MB,显而易见,结果是完全不同的。

当时上面N多因素混合在一起以后,IOPS的值就变得扑朔迷离了。所以,一般需要通过实际应用的测试才能获得。

IO Response Time

即IO的响应时间。IO响应时间是从操作系统内核发出一个IO请求到接收到IO响应的时间。因此,IO Response time除了包括磁盘获取数据的时间,还包括了操作系统以及在存储系统内部IO等待的时间。一般看,随IOPS增加,因为IO出现等待,IO响应时间也会随之增加。对一个OLTP系统,10ms以内的响应时间,是比较合理的。下面是一些IO性能示例:

  • 一个8K的IO会比一个64K的IO**速度快**,因为数据读取的少些。
  • 一个64K的IO会比8个8K的IO**速度快**,因为前者只请求了一个IO而后者是8个IO。
  • 串行IO会比随机IO**快**,因为串行IO相对随机IO说,即便没有Cache,串行IO在磁盘处理上也会少些操作。

需要注意,IOPS与IO Response Time有着密切的联系。一般情况下,IOPS增加,说明IO请求多了,IO Response Time会相应增加。但是会出现IOPS一直增加,但是IO Response Time变得非常慢,超过20ms甚至几十ms,这时候的IOPS虽然还在提高,但是意义已经不大,因为整个IO系统的服务时间已经不可取。

Throughput

为吞吐量。这个指标衡量标识了最大的数据传输量。如上说明,这个值在顺序访问或者大数据量访问的情况下会比较重要。尤其在大数据量写的时候。

吞吐量不像IOPS影响因素很多,吞吐量一般受限于一些比较固定的因素,如:网络带宽、IO传输接口的带宽、硬盘接口带宽等。一般他的值就等于上面几个地方中某一个的瓶颈。

一些概念

IO Chunk Size

即单个IO操作请求数据的大小。一次IO操作是指从发出IO请求到返回数据的过程。IO Chunk Size与应用或业务逻辑有着很密切的关系。比如像Oracle一类数据库,由于其block size一般为8K,读取、写入时都此为单位,因此,8K为这个系统主要的IO Chunk Size。IO Chunk Size

小,考验的是IO系统的IOPS能力;IO Chunk Size大,考验的时候IO系统的IO吞吐量。


Queue Deep

熟悉数据库的人都知道,SQL是可以批量提交的,这样可以大大提高操作效率。IO请求也是一样,IO请求可以积累一定数据,然后一次提交到存储系统,这样一些相邻的数据块操作可以进行合并,减少物理IO数。而且Queue Deep如其名,就是设置一起提交的IO请求数量的。一般Queue Deep在IO驱动层面上进行配置。

Queue Deep与IOPS有着密切关系。Queue Deep主要考虑批量提交IO请求,自然只有IOPS是瓶颈的时候才会有意义,如果IO都是大IO,磁盘已经成瓶颈,Queue Deep意义也就不大了。一般来说,IOPS的峰值会随着Queue Deep的增加而增加(不会非常显著),Queue Deep一般小于256。


随机访问(随机IO**)、顺序访问(顺序IO**)

随机访问的特点是每次**IO**请求的数据在磁盘上的位置跨度很大(如:分布在不同的扇区),因此N个非常小的IO请求(如:1K),必须以N次IO请求才能获取到相应的数据。

顺序访问的特点跟随机访问相反,它请求的数据在磁盘的位置是连续的。当系统发起N个非常小的IO请求(如:1K)时,因为一次IO是有代价的,系统会取完整的一块数据(如4K、8K),所以当第一次IO完成时,后续IO请求的数据可能已经有了。这样可以减少IO请求的次数。这也就是所谓的预取。

随机访问和顺序访问同样是有应用决定的。如数据库、小文件的存储的业务,大多是随机IO。而视频类业务、大文件存取,则大多为顺序IO。

选取合理的观察指标:

以上各指标中,不用的应用场景需要观察不同的指标,因为应用场景不同,有些指标甚至是没有意义的。

随机访问和IOPS: 在随机访问场景下,IOPS往往会到达瓶颈,而这个时候去观察Throughput,则往往远低于理论值。

顺序访问和Throughput:在顺序访问的场景下,Throughput往往会达到瓶颈(磁盘限制或者带宽),而这时候去观察IOPS,往往很小。

递归面试题汇总

Posted on

递归面试题汇总

您还未登录!|登录|注册|帮助

石锅拌饭

一介书生,读两三卷诗书,四体不勤,五谷不分,行六百里路途,乱七八糟到大学,久不思上进,十分颓废之人的胡言乱语

递归面试题汇总

分类: 面试题系列 数据结构与算法 2012-08-27 21:30 707人阅读 评论(0) 收藏 举报 目录(?)[+]

  1. 一前言
  2. 二递归算法初探
  3. 三递归算法题

  4. 汉诺塔问题

  5. 求二叉树的深度
  6. 判断二叉树是否平衡

  7. 排列算法

  8. 组合算法

一、前言

找工作面试时最喜欢问的是算法题,虽然我觉得有些取巧的算法题只是跟刷题量有关。但是为了找工作不得不加强算法,特别是基础算法,这是一个人基本功的体现。《算法导论》是不错的教材,不过大部头看起来确实需要发时间,到现在还只是大略看了一遍,很多推导过程没细心看下来,深以为憾,以后有时间还是要猛补。算法题中最能体现算法精髓的则非递归莫属了,我对递归一直总觉得是一知半解,为了加深自己的理解,决定把自己的一些想法记下来,方便更好的理清自己的思路,也恳请各路大牛指正。

二、递归算法初探

本段内容素材来自《linux C一站式编程》,作者是宋劲松老师,说实话这是目前看到的国内关于linux C编程的最好的一本技术书籍,强烈推荐!

关于递归的一个简单例子是求整数阶乘,n!=n/*(n-1)!,0!=1 。则可以写出如下的递归程序:

[cpp] view plaincopyprint?

  1. int factorial(int n)
  2. {
  3. if (n == 0)
  4. return 1;
  5. else {
  6. int recurse = factorial(n-1);
  7. int result = n /* recurse;
  8. return result;
  9. }
  10. }
    int factorial(int n) { if (n == 0) return 1; else { int recurse = factorial(n-1); int result = n /* recurse; return result; } }

factorial 这个函数就是一个递归函数,它调用了它自己。自己直接或间接调用自己的函数称为递归函数。这里的

factorial 是直接调用自己,有些时候函数A调用函数B,函数B又调用函数A,也就是函数A间接调用自己,这也是递归函数。如果觉得迷惑,可以把** factorial(n-1) **这一步看成是在调用另一个函数--另一个有着相同函数名和相同代码的函数,调用它就是跳到它的代码里执行,然后再返回

factorial(n-1) 这个调用的下一步继续执行。

为了证明递归算法的正确性,我们可以一步步跟进去看执行结果。记得刚学递归算法的时候,老是有丈二和尚摸不着头脑的感觉,那时候总是想着把递归一步步跟进去看执行结果。递归层次少还算好办,但是层次一多,头就大了,完全不知道自己跟到了递归的哪一层。比如求阶乘,如果只是factorial(3)跟进去问题不大,但是若是factorial(100)那就麻烦了。

事实上,我们并不是每个函数都需要跟进去看执行结果的,比如我们在自己的函数中调用printf函数时,并没有钻进去看它是怎么打印的,因为我们相信它能完成打印工作。我们在写factorial函数时有如下代码:

[cpp] view plaincopyprint?

  1. ...
  2. int recurse = factorial(n-1);
  3. int result = n /* recurse;
  4. ...
    ... int recurse = factorial(n-1); int result = n /* recurse; ...

这时,如果我们相信factorial是正确的,那么传递参数为n-1它就会返回(n-1)!,那么result=n/*(n-1)!=n!,从而这就是factorial(n)的结果。

当然这有点奇怪:我们还没写完

factorial 这个函数,凭什么要相信

factorial(n-1) 是正确的?可Leap of Faith本身就是Leap(跳跃)的,不是吗?如果你相信你正在写的递归函数是正确的,并调用它,然后在此基础上写完这个递归函数,那么它就会是正确的,从而值得你相信它正确。

这么说好像有点儿玄,我们从数学上严格证明一下

factorial 函数的正确性。刚才说了,

factorial(n) 的正确性依赖于

factorial(n-1) 的正确性,只要后者正确,在后者的结果上乘个

n 返回这一步显然也没有疑问,那么我们的函数实现就是正确的。因此要证明

factorial(n) 的正确性就是要证明

factorial(n-1) 的正确性,同理,要证明

factorial(n-1) 的正确性就是要证明

factorial(n-2) 的正确性,依此类推下去,最后是:要证明

factorial(1) 的正确性就是要证明

factorial(0) 的正确性。而

factorial(0) 的正确性不依赖于别的函数调用,它就是程序中的一个小的分支

return 1; 这个1是我们根据阶乘的定义写的,肯定是正确的,因此

factorial(1) 的实现是正确的,因此

factorial(2) 也正确,依此类推,最后

factorial(n) 也是正确的。其实这就是在中学时学的数学归纳法(Mathematical Induction),用数学归纳法来证明只需要证明两点:Base Case正确,递推关系正确。写递归函数时一定要记得写Base Case,否则即使递推关系正确,整个函数也不正确。如果

factorial 函数漏掉了Base Case,那么会导致无限循环。

三、递归算法题

从上一节的一个关于求阶乘的简单例子的论述,我们可以了解到递归算法的精髓:要从功能上理解函数,同时你要相信你正在写的函数是正确的,在此基础上调用它,那么它就是正确的。下面就从几个常见的算法题来看看如何理解递归,这是我的一些理解,欢迎大家提出更好的方法。

1)汉诺塔问题

汉诺塔问题是个常见问题,就是说有n个大小不等的盘子放在一个塔A上面,自底向上按照从小到大的顺序排列。要求将所有n个盘子搬到另一个塔C上面,可以借助一个塔B中转,但是要满足任何时刻大盘子不能放在小盘子上面。

基本思想分三步,先把上面的N-1个盘子经C移到B,然后将最底下的盘子移到C,再讲B上面的N-1个盘子经A移动到C。总的时间复杂度f(n)=2f(n-1)+1,所以f(n)=2^n-1。 [cpp] view plaincopyprint?

  1. void hano(char a, char b, char c, int n) {
  2. if (n > 0) {
  3. hano(a, c, b, n-1);
  4. move(a, c);
  5. hano(b, a, c, n-1);
  6. }
  7. }
  8. void move(char a, char b)
  9. {
  10. cout << a << "->" << b << endl;
  11. }
    void hano(char a, char b, char c, int n) { if (n > 0) { hano(a, c, b, n-1); move(a, c); hano(b, a, c, n-1); } } void move(char a, char b) { cout << a << "->" << b << endl; }

2)求二叉树的深度

这里的深度指的是二叉树从根结点到叶结点最大的高度,比如只有一个结点,则深度为1,如果有N层,则高度为N。

[cpp] view plaincopyprint?

  1. int depth(struct node/* root)
  2. {
  3. if (root == NULL)
  4. return 0;
  5. else {
  6. int lDepth = depth(root->left); //获取左子树深度
  7. int rDepth = depth(root->right); //获取右子树深度
  8. return lDepth>rDepth? lDepth+1: rDepth+1; //取较大值+1即为二叉树深度
  9. }
  10. }
    int depth(struct node/* root) { if (root == NULL) return 0; else { int lDepth = depth(root->left); //获取左子树深度 int rDepth = depth(root->right); //获取右子树深度 return lDepth>rDepth? lDepth+1: rDepth+1; //取较大值+1即为二叉树深度 } }

那么如何从功能上理解depth函数呢?我们可以知道定义该函数的目的就是求二叉树深度,也就是说我们要是完成了函数depth,那么depth(root)就能正确返回以root为根结点的二叉树的深度。因此我们的代码中depth(root->left)返回左子树的深度,而depth(root->right)返回右子树的深度。尽管这个时候我们还没有写完depth函数,但是我们相信depth函数能够正确完成功能。因此我们得到了lDepth和rDepth,而后通过比较返回较大值加1为二叉树的深度。如果不好理解,可以想象在depth中调用的函数depth(root->left)为另外一个同样名字完成相同功能的函数,这样就好理解了。

注意Base Case,这里就是当root==NULL时,则深度为0,函数返回0。

3)判断二叉树是否平衡

一颗平衡的二叉树是指其任意结点的左右子树深度之差不大于1。判断一棵二叉树是否是平衡的,可以使用递归算法来实现。

[cpp] view plaincopyprint?

  1. bool is_balanced(BinaryTreeNode/* pRoot)
  2. {
  3. if(pRoot == NULL) //基本情况,为空的话,返回true
  4. return true;
  5. int left = depth(pRoot->m_pLeft);
  6. int right = depth(pRoot->m_pRight);
  7. int diff = left - right; //计算左右子树深度之差
  8. if(diff > 1 || diff < -1) //如果深度之差大于1返回false
  9. return false;
  10. return is_balanced(pRoot->m_pLeft) && is_balanced(pRoot->m_pRight); //递归判断左右子树,注意是&&,即左右子树都必须是平衡的这棵二叉树才是平衡的
  11. }
    bool is_balanced(BinaryTreeNode/* pRoot) { if(pRoot == NULL) //基本情况,为空的话,返回true return true; int left = depth(pRoot->m_pLeft); int right = depth(pRoot->m_pRight); int diff = left - right; //计算左右子树深度之差 if(diff > 1 || diff < -1) //如果深度之差大于1返回false return false; return is_balanced(pRoot->m_pLeft) && is_balanced(pRoot->m_pRight); //递归判断左右子树,注意是&&,即左右子树都必须是平衡的这棵二叉树才是平衡的 }

该函数的功能定义是二叉树pRoot是平衡二叉树,即它所有结点的左右子树深度之差不大于1。首先判断根结点是否满足条件,如果不满足,则直接返回false。如果满足,则需要判断左子树和右子树是否都是平衡二叉树,若都是则返回true,否则false。

上面代码性能不高,会重复遍历结点,一个改进的算法是采用后序遍历的方式遍历树的结点,在遍历到本结点前我们已经遍历完了它的左右子树,我们只需要在遍历的时候记录结点的深度,就可以一边遍历一边判断该结点是否是平衡的。代码如下: [cpp] view plaincopyprint?

  1. bool is_balanced_2(BinaryTreeNode/ pRoot, int/ pDepth)
  2. {
  3. if(pRoot == NULL)
  4. {
  5. /*pDepth = 0;
  6. return true;
  7. }
  8. int left, right;
  9. if(is_balanced_2(pRoot->m_pLeft, &left) //左子树平衡
  10. && is_balanced_2(pRoot->m_pRight, &right)) //右子树平衡
  11. {
  12. int diff = left - right;
  13. if(diff <= 1 && diff >= -1)
  14. {
  15. /*pDepth = 1 + (left > right ? left : right);
  16. return true;
  17. }
  18. }
  19. return false;
  20. }
    bool is_balanced_2(BinaryTreeNode/ pRoot, int/ pDepth) { if(pRoot == NULL) { /pDepth = 0; return true; } int left, right; if(is_balanced_2(pRoot->m_pLeft, &left) //左子树平衡 && is_balanced_2(pRoot->m_pRight, &right)) //右子树平衡 { int diff = left - right; if(diff <= 1 && diff >= -1) { /pDepth = 1 + (left > right ? left : right); return true; } } return false; }

该函数功能定义是返回以pRoot为根的二叉树是否是平衡二叉树,同时把树的深度保存在pDepth指向的值中。基本情况是树为NULL,则深度为0,返回true。否则只有左右子树都是平衡的情况下,深度分别存在变量left和right中,判断左右子树的深度之差是否不大于1,如果是则返回true,注意还要设置树的深度值。 调用的函数定义如下:

[cpp] view plaincopyprint?

  1. bool IsBalanced(BinaryTreeNode/* pRoot)
  2. {
  3. int depth = 0;
  4. return is_balanced_2(pRoot, &depth);
  5. }
    bool IsBalanced(BinaryTreeNode/* pRoot) { int depth = 0; return is_balanced_2(pRoot, &depth); }

4)排列算法

排列算法也是递归的典范,记得当初第一次看时一层层跟代码,头都大了,现在从函数功能上来看确实好理解多了。先看代码:

[cpp] view plaincopyprint?

  1. void perm(int a[], int k, int N) { //k为起始位置,N为数组大小
  2. if (k == N-1) {
  3. output(a, N); //输出排列
  4. } else {
  5. for (int i=k; i<N; i++) {
  6. swap(a, i, k); //交换
  7. perm(a, k+1, N); //下一次排列
  8. swap(a, i, k); //恢复原来的序列
  9. }
  10. }
  11. }
    void perm(int a[], int k, int N) { //k为起始位置,N为数组大小 if (k == N-1) { output(a, N); //输出排列 } else { for (int i=k; i<N; i++) { swap(a, i, k); //交换 perm(a, k+1, N); //下一次排列 swap(a, i, k); //恢复原来的序列 } } }首先明确的是perm(a, k, N)函数的功能:输出数组a从位置k开始的所有排列,数组长度为N。这样我们在调用程序的时候,调用格式为perm(a, 0, N),即输出数组从位置0开始的所有排列,也就是该数组的所有排列。 基础条件是k==N-1,此时已经到达最后一个元素,一次排列已经完成,直接输出。否则,从位置k开始的每个元素都与位置k的值交换(包括自己与自己交换),然后进行下一次排列,排列完成后记得恢复原来的序列。 假定数组a大小N=3,则程序调用perm(a, 0, 3)可以如下理解:

第一次交换0,0,并执行perm(a, 1, 3),执行完再次交换0,0,数组此时又恢复成初始值。 第二次交换1,0(注意数组此时是初始值),并执行perm(a, 1, 3), 执行完再次交换1,0,数组此时又恢复成初始值。

第三次交换2,0,并执行perm(a, 1, 3),执行完成后交换2,0,数组恢复成初始值。 也就是说,从功能上看,首先确定第0个位置,然后调用perm(a, 1, 3)输出从1开始的排列,这样就可以输出所有排列。而第0个位置可能的值为a[0], a[1],a[2],这通过交换来保证第0个位置可能出现的值,记得每次交换后要恢复初始值。

如数组a={1,2,3},则程序运行输出结果为:1 2 3 ,1 3 2 ,2 1 3 ,2 3 1 ,3 2 1 ,3 1 2 。即先输出以1为排列第一个值的排列,而后是2和3为第一个值的排列。

5)组合算法

组合算法也可以用递归实现,只是它的原理跟0-1背包问题类似。即要么选要么不选,注意不能选重复的数。完整代码如下:

[cpp] view plaincopyprint?

  1. /#include
  2. using namespace std;
  3. /#define N 3 //数组大小为3
  4. int select[N] = {0}; //选择数组,用于存储数组哪些数字被选中。
  5. //输出数组中选中的数//
  6. void output(int a[], int n)
  7. {
  8. for (int i=0; i<n; i++) {
  9. if (select[i])
  10. cout << a[i] << " ";
  11. }
  12. cout << endl;
  13. }
  14. //数组a从位置i开始选取k个数//
  15. void combination(int a[], int i, int k)
  16. {
  17. if (i > N) return; //位置超出数组范围直接返回,否则非法访问会出段错误
  18. if (k == 0) { //选取完了,输出选取的数字
  19. output(a, N);
  20. } else {
  21. select[i] = 1;
  22. combination(a, i+1, k-1); //第i个数字被选取,从后续i+1开始选取k-1个数
  23. select[i] = 0;
  24. combination(a, i+1, k); //第i个数字不选,则从后续i+1位置开始还要选取k个数
  25. }
  26. }
  27. //组合主函数,包括选取1到n个数字//
  28. void combination_helper(int a[], int n) {
  29. for (int k=1; k<=n; k++) {
  30. combination(a, 0, k);
  31. }
  32. }
  33. int main()
  34. {
  35. int a[N] = {1, 2, 3};
  36. combination_helper(a, N);
  37. return 0;
  38. }
    /#include using namespace std; /#define N 3 //数组大小为3 int select[N] = {0}; //选择数组,用于存储数组哪些数字被选中。 //输出数组中选中的数// void output(int a[], int n) { for (int i=0; i N) return; //位置超出数组范围直接返回,否则非法访问会出段错误 if (k == 0) { //选取完了,输出选取的数字 output(a, N); } else { select[i] = 1; combination(a, i+1, k-1); //第i个数字被选取,从后续i+1开始选取k-1个数 select[i] = 0; combination(a, i+1, k); //第i个数字不选,则从后续i+1位置开始还要选取k个数 } } //组合主函数,包括选取1到n个数字// void combination_helper(int a[], int n) { for (int k=1; k<=n; k++) { combination(a, 0, k); } } int main() { int a[N] = {1, 2, 3}; combination_helper(a, N); return 0; } 分享到:

  39. 上一篇:数学之美—快排为什么那样快

  40. 下一篇:组合算法面试题 查看评论

    暂无评论 您还没有登录,请[登录][注册]

/* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场 TOP

个人资料

ssjhust123

  • 访问:57759次
  • 积分:1427分
  • 排名:第6777名

  • 原创:79篇

  • 转载:22篇
  • 译文:3篇
  • 评论:43条

文章搜索

文章分类

展开

阅读排行

最新评论

ssjhust123: @zhuzi51job:哈哈,不客气,请多指正。

zhuzi51job: 写的很详细,谢谢你的分享。

huhuang03: mark

Flyhigh: @naruto2011sasuke:不对,这里就不应该这么写,应该是只要有“(”,则直接进栈。进栈以...

ssjhust123: @handong1587:呵呵,不客气。请多多指正。

handong1587: 讲得很清楚,谢谢!

haiyaojing: 灰常感谢~

ssjhust123: @tcstory::-),最近都没有时间写咯。

tcstory: 师兄啊 代码啥时候贴上来啊

tcstory: 谢谢了 写得非常好 比我的书《数据结构使用C语言》 第三版 朱战立 里面的 写得好多了

公司简介|招贤纳士|广告服务|银行汇款帐号|联系方式|版权声明|法律顾问|问题报告QQ客服 微博客服 论坛反馈 联系邮箱:webmaster@csdn.net 服务热线:400-600-2320京 ICP 证 070598 号北京创新乐知信息技术有限公司 版权所有世纪乐知(北京)网络技术有限公司 提供技术支持江苏乐知网络技术有限公司 提供商务支持Copyright © 1999-2012, CSDN.NET, All Rights Reserved GongshangLogo