1、查找表中多余的重復記錄,重復記錄是根據單個字段(peopleId)來判斷。
站在用戶的角度思考問題,與客戶深入溝通,找到來賓網站設計與來賓網站推廣的解決方案,憑借多年的經驗,讓設計與互聯網技術結合,創造個性化、用戶體驗好的作品,建站類型包括:成都網站設計、成都網站制作、企業官網、英文網站、手機端網站、網站推廣、申請域名、虛擬空間、企業郵箱。業務覆蓋來賓地區。
2、刪除表中多余的重復記錄,重復記錄是根據單個字段(peopleId)來判斷,只留有rowid最小的記錄。
3、查找表中多余的重復記錄(多個字段)。
4、刪除表中多余的重復記錄(多個字段),只留有rowid最小的記錄。
5、查找表中多余的重復記錄(多個字段),不包含rowid最小的記錄。就完成了。
這個函數的功能主要是用于去除給定字符串中重復的字符串.在使用中需要指定字符串的分隔符.示例:
str := RemoveSameStr('zhang,Zhang,bao,Bao,bao,zhang', ',');
輸出: zhang,Zhang,bao,Bao
--SQL
str varchar2(1000);
currentIndex number;
startIndex number;
endIndex number;
type str_type is table of varchar2(30) index by binary_integer;
arr str_type;
Result varchar2(1000);
begin
-- 空字符串
if oldStr is null then
return('');
end if;
--字符串太長
if length(oldStr) 1000 then
return(oldStr);
end if;
str := oldStr;
currentIndex := 0;
startIndex := 0;
loop
currentIndex := currentIndex + 1;
endIndex := instr(str, sign, 1, currentIndex);
if (endIndex = 0) then
exit;
end if;
arr(currentIndex) := trim(substr(str,
startIndex + 1,
endIndex - startIndex - 1));
startIndex := endIndex;
end loop;
--取最后一個字符串:
arr(currentIndex) := substr(str, startIndex + 1, length(str));
--去掉重復出現的字符串:
for i in 1 .. currentIndex - 1 loop
for j in i + 1 .. currentIndex loop
if arr(i) = arr(j) then
arr(j) := '';
end if;
end loop;
end loop;
str := '';
for i in 1 .. currentIndex loop
if arr(i) is not null then
str := str || sign || arr(i);
--數組置空:
arr(i) := '';
end if;
end loop;
--去掉前面的標識符:
Result := substr(str, 2, length(str));
return(Result);
end RemoveSameStr;
轉載,僅供參考。
可按如下方法去除:
如,test表中有如下數據:
現在要刪除那么重復的數據,只保留其中一條,可用如下語句:
delete?from?test?where?rowid?not?in?(select?max(rowid)?from?test?group?by?name);
commit;
執行后結果為:
Oracle數據庫重復的數據一般有兩種去重方法,一、完全重復數據去重;二、部分字段數據重復去重。
一、完全重復數據去重方法
對于表中完全重復數據去重,可以采用以下SQL語句。
Code
CREATETABLE"#temp"AS (SELECTDISTINCT * FROM 表名);--創建臨時表,并把DISTINCT 去重后的數據插入到臨時表中
truncateTABLE 表名;--清空原表數據
INSERTINTO 表名(SELECT * FROM"#temp");--將臨時表數據插入到原表中
DROPTABLE"#temp";--刪除臨時表
具體思路是,首先創建一個臨時表,然后將DISTINCT之后的表數據插入到這個臨時表中;然后清空原表數據;再講臨時表中的數據插入到原表中;最后刪除臨時表。
二、部分數據去重方法
首先查找重復數據
select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1
將上面的號改為=號就可以查詢出沒有重復的數據了。
想要刪除這些重復的數據,可以使用下面語句進行刪除:
deletefrom 表名 a where 字段1,字段2 in
(select 字段1,字段2,count(*) from 表名 groupby 字段1,字段2 havingcount(*) 1)
oracle產品服務
甲骨文公司產品主要有以下幾類:
甲骨文股份有限公司
1.服務器及工具
數據庫服務器:2013年最新版本Oracle 12C。
應用服務器:Oracle Application Server。
開發工具:OracleJDeveloper,Oracle Designer,Oracle Developer,等等。
2.企業應用軟件
企業資源計劃(ERP)軟件。已有10年以上的歷史。2005年,并購了開發企業軟件的仁科軟件公司(PeopleSoft)以增強在這方面的競爭力。
客戶關系管理(CRM)軟件。自1998年開始研發這種軟件。2005年,并購了開發客戶關系管理軟件的希柏軟件公司(Siebel)。
3. Oracle職業發展力計劃(Oracle WDP)
Oracle WDP 全稱為Oracle Workforce Development Program,是Oracle (甲骨文)公司專門面向學生、個人、在職人員等群體開設的職業發展力課程。Oracle的技術廣泛應用于各行各業,其中電信、電力、金融、政府及大量制造業都需要Oracle技術人才,Oracle公司針對職業教育市場在全球推廣的項目,其以低廉的成本給這部分人群提供Oracle技術培訓,經過系統化的實訓,讓這部分人群能夠迅速掌握Oracle最新的核心技術,并能勝任企業大型數據庫管理、維護、開發工作。
重復的數據可能有這樣兩種情況,第一種時表中只有某些字段一樣,第二種是兩行記錄完全一樣。Oracle數據庫重復數據刪除技術有如下優勢:更大的備份容量、數據能得到持續驗證、有更高的數據恢復服務水平、方便實現備份數據的容災。
一、刪除部分字段重復數據先來談談如何查詢重復的數據吧。
下面語句可以查詢出那些數據是重復的:
select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1
將上面的號改為=號就可以查詢出沒有重復的數據了。
想要刪除這些重復的數據,可以使用下面語句進行刪除
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面的語句非常簡單,就是將查詢到的數據刪除掉。不過這種刪除執行的效率非常低,對于大數據量來說,可能會將數據庫吊死。所以我建議先將查詢到的重復的數據插入到一個臨時表中,然后對進行刪除,這樣,執行刪除的時候就不用再進行一次查詢了。如下:
CREATE
TABLE
臨時表
AS
(select
字段1,字段2,count(*)
from
表名
group
by
字段1,字段2
having
count(*)
1)
上面這句話就是建立了臨時表,并將查詢到的數據插入其中。
下面就可以進行這樣的刪除操作了:
delete
from
表名
a
where
字段1,字段2
in
(select
字段1,字段2
from
臨時表);
這種先建臨時表再進行刪除的操作要比直接用一條語句進行刪除要高效得多。
這個時候,大家可能會跳出來說,什么?你叫我
正在看的ORACLE教程是:oracle快速刪除重復的記錄。做項目的時候,一位同事導數據的時候,不小心把一個表中的數據全都搞重了,也就是說,這個表里所有的記錄都有一條重復的。這個表的數據是千萬級的,而且是生產系統。也就是說,不能把所有的記錄都刪除,而且必須快速的把重復記錄刪掉。
對此,總結了一下刪除重復記錄的方法,以及每種方法的優缺點。
為了陳訴方便,假設表名為Tbl,表中有三列col1,col2,col3,其中col1,col2是主鍵,并且,col1,col2上加了索引。
1、通過創建臨時表
可以把數據先導入到一個臨時表中,然后刪除原表的數據,再把數據導回原表,SQL語句如下:
creat table tbl_tmp (select distinct* from tbl);truncate table tbl;//清空表記錄insert into tbl select * from tbl_tmp;//將臨時表中的數據插回來。
這種方法可以實現需求,但是很明顯,對于一個千萬級記錄的表,這種方法很慢,在生產系統中,這會給系統帶來很大的開銷,不可行。
2、利用rowid
在oracle中,每一條記錄都有一個rowid,rowid在整個數據庫中是唯一的,rowid確定了每條記錄是oracle中的哪一個數據文件、塊、行上。在重復的記錄中,可能所有列的內容都相同,但rowid不會相同。SQL語句如下:
delete from tbl where rowid in (select a.rowid from tbl a, tbl b where a.rowidb.rowid and a.col1=b.col1 and a.col2 = b.col2)
如果已經知道每條記錄只有一條重復的,這個sql語句適用。但是如果每條記錄的重復記錄有N條,這個N是未知的,就要考慮適用下面這種方法了。
3、利用max或min函數
這里也要使用rowid,與上面不同的是結合max或min函數來實現。SQL語句如下
delete from tbl awhere rowid not in (select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里max使用min也可以
或者用下面的語句
delete from tbl awhere rowid(select max(b.rowid) from tbl b where a.col1=b.col1 and a.col2 = b.col2);//這里如果把max換成min的話,前面的where子句中需要把""改為""
跟上面的方法思路基本是一樣的,不過使用了group by,減少了顯性的比較條件,提高效率。SQL語句如下:
deletefrom tbl where rowid not in (select max(rowid) from tbl tgroup by t.col1, t.col2);delete from tbl where (col1, col2) in (select col1,col2 from tblgroup bycol1,col2havingcount(*) 1)and rowidnotin(selectnin(rowid)fromtblgroup bycol1,col2havingcount(*) 1)
還有一種方法,對于表中有重復記錄的記錄比較少的,并且有索引的情況,比較適用。假定col1,col2上有索引,并且tbl表中有重復記錄的記錄比較少,SQL語句如下4、利用group by,提高效率
網站欄目:oracle如何去除重復,Oracle 去重復
文章出自:http://vcdvsql.cn/article20/dsdjsjo.html
成都網站建設公司_創新互聯,為您提供建站公司、關鍵詞優化、虛擬主機、靜態網站、網頁設計公司、營銷型網站建設
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯