Query restructure

Question

Query restructure

Kangana Beri

SSCrazy

Points: 2134
More actions
August 20, 2008 at 4:09 pm

#189658

I have a query which updates columns in Table1 from max value in Table2 joining on Table1 and Table2 as follows:
UPDATE TAB1
SET TAB1.COL1 = TAB2.COL1,
TAB1.COL2 = TAB2.COL2
FROM TAB1 , TAB2 B
WHERE TAB1.COL3 = TAB2.COL3
AND TAB1.COL4 = TAB2.COL4
AND TAB2.COL1 = ( SELECT MAX(COL1)
FROM TAB2 C
WHERE TAB1.COL3 = C.COL3
AND TAB1.COL4 = C.COL4)
Although query is serving the requirement I have but I suspect there may be a better way to structure this query. Any suggestions?

Viewing 8 posts - 1 through 7 (of 7 total)

You must be logged in to reply to this topic. Login to reply

Jack Corbett SSC Guru Points: 184393 More actions · Answer 1

What does your execution plan look like? Based on what I can see of the criteria I don't really see a better way. The only thing you might want to do is create a derived table in the from instead of a correlated subquery in the where. Something like this:

[font="Courier New"]UPDATE TAB1

SET TAB1.COL1 = TAB2.COL1,

TAB1.COL2 = TAB2.COL2

FROM

TAB1 JOIN

TAB2 B ON

TAB1.COL3 = TAB2.COL3 AND

TAB1.COL4 = TAB2.COL4 JOIN

(SELECT

MAX(COL1) AS COL1

FROM

TAB2 C

WHERE

TAB1.COL3 = C.COL3 AND

TAB1.COL4 = C.COL4) AS D ON

B.Col1 = D.Col1

[/font]

As always test both, checking the plans and stats.

Jack Corbett
Consultant - Straight Path Solutions
Check out these links on how to get faster and more accurate answers:
Forum Etiquette: How to post data/code on a forum to get the best help
Need an Answer? Actually, No ... You Need a Question

Ken McKelvey SSCoach Points: 18775 More actions · Answer 2

I think Jack meant something like:

UPDATE T1

SET Col1 = T2.Col1

&nbsp&nbsp&nbsp&nbsp,Col2 = T2.Col2

FROM Tab1 T1

&nbsp&nbsp&nbsp&nbspJOIN Tab2 T2

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspON T1.Col3 = T2.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T1.Col4 = T2.Col4

&nbsp&nbsp&nbsp&nbspJOIN

&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT C.Col3, C.Col4, MAX(C.Col1) AS Col1

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspFROM Tab2 C

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspGROUP BY C.Col3, C.Col4

&nbsp&nbsp&nbsp&nbsp) D

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspON T2.Col3 = D.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T2.Col4 = D.Col4

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T2.Col1 = D.Col1

I think, however, that the TSQL UPDATE syntax is dangerous in this instance.

If there are multiple rows of in TAB2 containing the same Col1, Col3 and Col4 values with

different values in Col2 then a random last value of Col2 will be updated.

To get around this, either the value of Col2 needs to be defined:

UPDATE T1

SET Col1 = T2.Col1

&nbsp&nbsp&nbsp&nbsp,Col2 = T2.Col2

FROM Tab1 T1

&nbsp&nbsp&nbsp&nbspJOIN Tab2 T2

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspON T1.Col3 = T2.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T1.Col4 = T2.Col4

&nbsp&nbsp&nbsp&nbspJOIN

&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT C.Col3, C.Col4, MAX(C.Col1) AS Col1

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspFROM Tab2 C

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspGROUP BY C.Col3, C.Col4

&nbsp&nbsp&nbsp&nbsp) D

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspON T2.Col3 = D.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T2.Col4 = D.Col4

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T2.Col1 = D.Col1

&nbsp&nbsp&nbsp&nbspJOIN

&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT C2.Col3, C2.Col4, C2.Col1, Max(C2.col2) AS Col2

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspFROM Tab2 C2

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspGROUP BY C2.Col3, C2.Col4, C2.Col1

&nbsp&nbsp&nbsp&nbsp) D2

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspON D.Col3 = D2.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND D.Col4 = D2.Col4

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND D.Col1 = D2.Col1

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T2.Col2 = D2.Col2

or the ANSI UPDATE syntax should be used to report an error if there is more than one value of Col2

UPDATE Tab1

SET Col1 =

&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT T21.Col1

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspFROM Tab2 T21

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspWHERE T21.Col3 = Tab1.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T21.Col4 = Tab1.Col4

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T21.Col1 =

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT MAX(T211.Col1)

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspFROM Tab2 T211

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspWHERE T211.Col3 = T21.Col3

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspAND T211.Col4 = T21.Col4

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp)

&nbsp&nbsp&nbsp&nbsp)

&nbsp&nbsp&nbsp&nbsp,Col2 =

&nbsp&nbsp&nbsp&nbsp(

&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbsp&nbspSELECT T21.Col2