exp/imp与expdp/impdp区别 _MySQL, Oracle及数据库讨论区_Weblogic技术|Tuxedo技术|中间件技术|Oracle论坛|JAVA论坛|Linux/Unix技术|hadoop论坛

总帖数

每页帖数

1/1页

返回列表

发起投票

查看: 2790 | 回复: 0

主题： exp/imp与expdp/impdp区别

syxian

注册用户

等级：新兵
经验：51
发帖：67
精华：0
注册：2011-10-15
状态：离线
发送短消息息给syxian

加好友发送短消息息给syxian

发消息

发表于：

2015-5-6 10:24:45 | [全部帖] [楼主帖]

楼主

在平常备库和数据库迁移的时候，当遇到大的数据库的时候在用exp的时候往往是需要好几个小时，耗费大量时间。oracle10g以后可以用expdp来导出数据库花费的时间要远小于exp花费的时间，而且文件也要小很多。

1.使用expdp要先在数据库中创建directory,并给相应的用户read,write权限.
SQL>create dexp和empdp的区别irectory dmpdir as ‘/u01/dmdir’;

SQL>grant read,write on directory to test;

2.常用导出方法

$expdp scott/tiger DUMPFILE=scott.dmp DIRECTORY=dmpdir SCHEMAS=test
$expdp scott/tiger DUMPFILE=tmp_dump.dmp DIRECTORY=dmpdir TABLES=(tmp_test:p1,tmp_test:p2) JOB_NAME=tmp_dump LOGFILE=tmp_dump.log
$expdp scott/tiger DUMPFILE=full.dmp DIRECTORY=dmpdir FULL=Y JOB_NAME=full
$expdp scott/timer DUMPFILE=tmp_200703.dmp DIRECTORY=dmpdir TABLES=tmp QUERY=\”where to_char$create_time,\’yyyy-mm-dd\’$\<\'2007-04\'\"

常用一些参数说明:
SCOTT/TIGER:用户/密码(*)
DUMPFILE:导出后的文件名(*)
DIRECTORY:导出文件存放位置(位于服务器端)(*)
CONTENT:导出文件中包含的内容(默认为:ALL,可选DATA_ONLY/METADATA_ONLY)
FILESIZE:指定导出文件大小(单位为bytes).
JOB_NAME:此次导出进程使用的名称,方便跟踪查询(可选)
LOGFILE:日志文件名(默认为:export.log)
INCLUDE:导出时包含指定的类型

(例:INCLUDE=TABLE_DATA,
INCLUDE=TABLE:"LIKE 'TAB%'"
INCLUDE=TABLE:”NOT LIKE ‘TAB%’”…)

EXCLUDE:导出时排除的数据类型(例:EXCLUDE=TABLE:EMP)
FULL:全库导出时使用(同EXP的FULL,默认为N)
SCHEMA:导出某一个SCHEMA下的所有数据
TABLES:按表导出(这里的方法和EXP一样)
TABLESPACE:指定一个表空间导出.
QUERY:按表导出时,使用条件语句限定导出范围(同exp中的QUERY)

TRANSPORT_FULL_CHECK:
TRANSPORT_TABLESPACES:
FLASHBACK_SCN:
FLASHBACK_TIME:

PARALLEL:并行操作

PARFILE:
NETWORK_LINK:

当 Data Pump Export (DPE) 运行时，按 Control-C；它将阻止消息在屏幕上显示，但不停止导出进程本身。相反，它将显示 DPE 提示符（如下所示）。进程现在被认为处于“交互式”模式：

Export>

这种方法允许在这个 DPE 作业上输入命令查询及控制当前作业。

3.您可以通过 PARALLEL 参数为导出使用一个以上的线程来显著地加速作业。每个线程创建一个单独的转储文件，因此参数 dumpfile 应当拥有和并行度一样多的项目。您可以指定通配符作为文件名，而不是显式地输入各个文件名，例如：

expdp ananda/abc123 tables=CASES directory=DPDATA1 dumpfile=expCASES_%U.dmp parallel=4 job_name=Cases_Export

注意:dumpfile 参数拥有一个通配符 %U，它指示文件将按需要创建，格式将为expCASES_nn.dmp，其中nn 从 01 开始，然后按需要向上增加。
在并行模式下，状态屏幕将显示四个工作进程。（在默认模式下，只有一个进程是可见的）所有的工作进程同步取出数据，并在状态屏幕上显示它们的进度。
分离访问数据文件和转储目录文件系统的输入/输出通道是很重要的。否则，与维护 Data Pump 作业相关的开销可能超过并行线程的效益，并因此而降低性能。并行方式只有在表的数量多于并行值并且表很大时才是有效的。

4.exp/imp与expdp/impdp区别:
(1) 把用户usera的对象导到用户userb,用法区别在于fromuser=usera touser=userb ,remap_schema=’usera’:'usera’ 。例如:imp system/passwd fromuser=usera touser=userb file=/oracle/exp.dmp log=/oracle/exp.log;

impdp system/passwd directory=expdp dumpfile=expdp.dmp remap_schema=’usera’:'userb’ logfile=/oracle/exp.log;

(2) 更换表空间，用exp/imp的时候，要想更改表所在的表空间，需要手工去处理一下，
如alter table xxx move tablespace_new之类的操作。
用impdp只要用remap_tablespace=’tabspace_old’:'tablespace_new’
(3) 当指定一些表的时候，使用exp/imp 时，tables的用法是 tables=(‘table1′,’table2′,’table3′)。
expdp/impdp的用法是tables=’table1′,’table2′,’table3′
(4) 是否要导出数据行

exp （ROWS=Y 导出数据行，ROWS=N 不导出数据行）
expdp content（ALL:对象＋导出数据行，DATA_ONLY：只导出对象，METADATA_ONLY：只导出数据的记录）

(5) expdp是[10g]的新特性而且只能在服务器执行。而exp/imp是通用的。
(6) oracle11g中有个新特性，当表无数据时，不分配segment，以节省空间,所以exp导不出空表。解决的办法是用expdp，当然也可以设置deferred_segment_creation 参数或者 insert一行，再rollback，但是这样很麻烦。

EXP常规模式、EXP直接路径模式和EXPDP三种方式导出的性能对比

1.首先是EXP的常规路径导出：

exp zhejiang/zhejiang file=/data1/zj_regular.dmp buffer=20480000

常规EXP导出方式执行了1小时24分钟。

2.直接路径导出方式：

exp zhejiang/zhejiang file=/data1/zj_direct.dmp buffer=20480000
recordlength=65535 direct=y

直接路径导入用时18分钟，比常规路径导出速度有一个明显的提高。

3.数据泵的导出速度。

expdp zhejiang/zhejiang dumpfile=zj_datapump.dp directory=d_test schemas=zhejiang

数据泵的导出时间仅用了14分钟，比直接路径导入方式还快了20%多。而且观察三个导出文件的大小可以发现，导出速度越快对应的文件也越小，其中数据泵的导出方式得到的文件要比EXP方式小将近1.5G。

IMP和IMPDP导入性能对比

1.IMP的导入速度：

imp zhejiang/zhejiang file=/data1/zj_regular.dmp full=y buffer=20480000 log=/data1/zj_regular.log

IMP导入花费了3小时17分钟，

2.IMPdp的导入速度：

impdp zhejiang/zhejiang DUMPFILE=zj_datapump.dp DIRECTORY=d_test FULL=y LOGFILE=zj_datapump.log

数据泵的导入操作居然花了3个小时8分钟的时间，和IMP的导入速度十分接近，看来并非所有情况下都像Oracle描述的那样，数据泵的导入比普通导入效率有大幅度的提高。

上面一篇文章的测试中发现IMPDP的导入速度和IMP导入速度相差无几。而Oracle在介绍数据泵的时候，提到IMPDP的导入速度最高是IMP的10倍。不过好在IMPDP还是可以优化调整的，那就是通过设置PARALLEL来提高IMPDP的并行度。

首先还是看一下CPU的数量：

SQL> show parameter cpu

由于数据库服务器的CPU个数为2，下面尝试设置PARALLEL为2来进行导入

impdp zhejiang/zhejiang DUMPFILE=zj_datapump.dp DIRECTORY=d_test FULL=y LOGFILE=zj_datapump.log parallel=2

采用并行度为2的导入方式，发现速度果然提高了很多。并行度为1的导入速度是3小时8分钟，而现在用了不到2个半小时。

由于并行度设置不应该超过CPU数的2倍，因此尝试平行度3和4的导入，导入时间和并行度2十分接近。看来已经无法再使用通过提高并行度的方法来提高性能了。

1.先看直接导出的性能：

$ expdp zhejiang/zhejiang directory=d_test dumpfile=zhejiang.dp

整个导出操作大概用了14分半，

2.尝试使用并行度2进行导出，这时仍然设置一个导出的数据文件：

$ expdp zhejiang/zhejiang directory=d_test dumpfile=zhejiang_p2_1file.dp parallel=2

整个导入过程不到14分钟，不过这个性能的提升实在不是很明显。不过这是有原因的，由于设置了并行度，两个进程在同时执行导出操作，但是二者要将导出的数据写入同一个数据文件中，因此必然会导致资源的争用

3.仍然使用并行度2，但是同时设置两个数据文件再次检查导出性能：

$ expdp zhejiang/zhejiang directory=d_test dumpfile=zhejiang_p2_2file1.dp,zhejiang_p2_2file2.dp parallel=2

这次导出仅仅用了10分半，导出的效率大大的提高。

4.测试一下并行度4，分别导出到4个数据文件中：

用了9分钟整导出完成，设置成并行度4仍然可以获得一定的性能提升，但是并不明显了，这主要是由于整个性能的瓶颈已经不是单个进程的处理能力，多半性能的瓶颈已经变成了磁盘IO瓶颈，此时单单靠增加并行度已经无法明显提升性能了。

--转自

本版精华
热门帖子

操作引用/回复

总帖数

每页帖数

1/1页

返回列表

用户登录

Weblogic中间件技术论坛

Tuxedo中间件技术论坛

数据库论坛

Java论坛

Linux/unix论坛

网站地图