Oracle數據庫重復的數據一般有兩種去重方法,一、完全重復數據去重;二、部分字段數據重復去重。
成都創新互聯是一家集網站建設,玉溪企業網站建設,玉溪品牌網站建設,網站定制,玉溪網站建設報價,網絡營銷,網絡優化,玉溪網站推廣為一體的創新建站企業,幫助傳統企業提升企業形象加強企業競爭力。可充分滿足這一群體相比中小企業更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們為更多的企業打造出實用型網站。
一、完全重復數據去重方法
對于表中完全重復數據去重,可以采用以下SQL語句。
Code
CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--創建臨時表,并把DISTINCT 去重后的數據插入到臨時表中
truncateTABLE 表名;--清空原表數據
INSERTINTO 表名(SELECT * FROM"#temp");--將臨時表數據插入到原表中
DROPTABLE"#temp";--刪除臨時表
具體思路是,首先創建一個臨時表,然后將DISTINCT之后的表數據插入到這個臨時表中;然后清空原表數據;再講臨時表中的數據插入到原表中;最后刪除臨時表。
二、部分數據去重方法
首先查找重復數據
select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1
將上面的號改為=號就可以查詢出沒有重復的數據了。
想要刪除這些重復的數據,可以使用下面語句進行刪除:
deletefrom 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1)
oracle產品服務
甲骨文公司產品主要有以下幾類:
甲骨文股份有限公司
1.服務器及工具
數據庫服務器:2013年最新版本Oracle 12C。
應用服務器:Oracle Application Server。
開發工具:OracleJDeveloper,Oracle Designer,Oracle Developer,等等。
2.企業應用軟件
企業資源計劃(ERP)軟件。已有10年以上的歷史。2005年,并購了開發企業軟件的仁科軟件公司(PeopleSoft)以增強在這方面的競爭力。
客戶關系管理(CRM)軟件。自1998年開始研發這種軟件。2005年,并購了開發客戶關系管理軟件的希柏軟件公司(Siebel)。
3. Oracle職業發展力計劃(Oracle WDP)
Oracle WDP 全稱為Oracle Workforce Development Program,是Oracle (甲骨文)公司專門面向學生、個人、在職人員等群體開設的職業發展力課程。Oracle的技術廣泛應用于各行各業,其中電信、電力、金融、政府及大量制造業都需要Oracle技術人才,Oracle公司針對職業教育市場在全球推廣的項目,其以低廉的成本給這部分人群提供Oracle技術培訓,經過系統化的實訓,讓這部分人群能夠迅速掌握Oracle最新的核心技術,并能勝任企業大型數據庫管理、維護、開發工作。
1、查找表中多余的重復記錄,重復記錄是根據單個字段(peopleId)來判斷。
2、刪除表中多余的重復記錄,重復記錄是根據單個字段(peopleId)來判斷,只留有rowid最小的記錄。
3、查找表中多余的重復記錄(多個字段)。
4、刪除表中多余的重復記錄(多個字段),只留有rowid最小的記錄。
5、查找表中多余的重復記錄(多個字段),不包含rowid最小的記錄。就完成了。
正在看的ORACLE教程是:oracle快速刪除重復的記錄。做項目的時候,一位同事導數據的時候,不小心把一個表中的數據全都搞重了,也就是說,這個表里所有的記錄都有一條重復的。這個表的數據是千萬級的,而且是生產系統。也就是說,不能把所有的記錄都刪除,而且必須快速的把重復記錄刪掉。
對此,總結了一下刪除重復記錄的方法,以及每種方法的優缺點。
為了陳訴方便,假設表名為Tbl,表中有三列col1,col2,col3,其中col1,col2是主鍵,并且,col1,col2上加了索引。
1、通過創建臨時表
可以把數據先導入到一個臨時表中,然后刪除原表的數據,再把數據導回原表,SQL語句如下:
creat table tbl_tmp (select distinct* from tbl);truncate table tbl;//清空表記錄insert into tbl select * from tbl_tmp;//將臨時表中的數據插回來。
這種方法可以實現需求,但是很明顯,對于一個千萬級記錄的表,這種方法很慢,在生產系統中,這會給系統帶來很大的開銷,不可行。
2、利用rowid
在oracle中,每一條記錄都有一個rowid,rowid在整個數據庫中是唯一的,rowid確定了每條記錄是oracle中的哪一個數據文件、塊、行上。在重復的記錄中,可能所有列的內容都相同,但rowid不會相同。SQL語句如下:
delete from tbl where rowid in (select a.rowid from tbl a, tbl b where a.rowidb.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已經知道每條記錄只有一條重復的,這個sql語句適用。但是如果每條記錄的重復記錄有N條,這個N是未知的,就要考慮適用下面這種方法了。
3、利用max或min函數
這里也要使用rowid,與上面不同的是結合max或min函數來實現。SQL語句如下
delete from tbl awhere rowid not in (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里max使用min也可以
或者用下面的語句
delete from tbl awhere rowid(select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里如果把max換成min的話,前面的where子句中需要把""改為""
跟上面的方法思路基本是一樣的,不過使用了group by,減少了顯性的比較條件,提高效率。SQL語句如下:
deletefrom tbl where rowid not in (select max(rowid) from tbl tgroup by t.col1, t.col2);delete from tbl where (col1, col2) in (select col1,col2 from tblgroup bycol1,col2havingcount(*) 1)and rowidnotin(selectnin(rowid)fromtblgroup bycol1,col2havingcount(*) 1)
還有一種方法,對于表中有重復記錄的記錄比較少的,并且有索引的情況,比較適用。假定col1,col2上有索引,并且tbl表中有重復記錄的記錄比較少,SQL語句如下4、利用group by,提高效率
當前標題:oracle如何去重復,oracle如何去重復數據
分享鏈接:http://m.kartarina.com/article34/dseegpe.html
成都網站建設公司_創新互聯,為您提供小程序開發、外貿建站、網站排名、服務器托管、外貿網站建設、面包屑導航
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯