Neurális térreprezentációk alkalmazása és fejlesztése ortofotók előállítására / Application and Development of Neural Scene Representations for Orthophoto Generation

Primary tabs

Erre a témakiírásra nem lehet jelentkezni.
Nyilvántartási szám: 
26/05
Témavezető neve: 
Témavezető e-mail címe:
koppanyi.zoltan@emk.bme.hu
A témavezető teljes publikációs listája az MTMT-ben:
A téma rövid leírása, a kidolgozandó feladat részletezése: 

A kutatás célja a neurális hálózatokon alapuló térrekonstrukciós modellek – mint például a Gauss-folt (Gaussian splat) és a neurális sugárzási mező (Neural Radiance Field, NeRF) – alkalmazhatóságának vizsgálata, valamint ezekre építve új vagy újszerű modellek kidolgozása nagy pontosságú ortofotók előállítására. A téma középpontjában a hagyományos fotogrammetriai eljárások és a modern neurális reprezentációk összehasonlítása áll, különös tekintettel a geometriai és radiometriai pontosságra. A kutatás továbbá foglalkozik ezen modellek számítási igényének csökkentésével, kihasználva az ortofotók és az ortografikus leképezés sajátosságait.
A légi- vagy drónfelvételekből előállított ortofotók a gyakorlati földmérési és távérzékelési feladatok fontos végtermékei, mivel lehetővé teszik a torzulásmentes, közvetlen méréseket. A jelenleg alkalmazott módszerekkel készített ortofotók azonban különböző torzulásokat tartalmazhatnak, valamint gyakran megfigyelhetők rajtuk „varrási” határok. Ennek egyik oka, hogy ezek az eljárások jellemzően a meglévő képek textúráját vetítik rá egy felszín modellre, új textúra előállítására nem képesek. Ezzel szemben a neurális alapú modellek – például a Gauss-foltok és a NeRF-ek – képesek térben folytonos, valósághű reprezentációk létrehozására, még hiányos képfedettség esetén is, ezáltal implicit módon „interpolálva” a hiányzó információt. A kutatás célja ennek megfelelően olyan ortorektifikált képek előállítása, amelyek vizuálisan valósághűek, az eredeti felvételek minőségét megközelítik, ugyanakkor geometriailag is helyesek.
A vizsgált modellek egyik jelentős hátránya a magas számítási igény és a dedikált grafikus hardver szükségessége. Ez különösen problémás a légi és drónos fotogrammetriában, ahol a feldolgozandó adathalmazok nagy felbontásúak és nagy elemszámúak. A szakirodalomban szereplő módszerek elsősorban általános 3D térrekonstrukcióra készültek, így nem veszik figyelembe az ortoprojekció speciális kényszereit. Feltételezhető, hogy ezen kényszerek beépítésével a modell struktúrája egyszerűsíthető, a paraméterek száma és ezáltal a számítási igény csökkenthető. További vizsgálati irány a különböző inicializálási stratégiák elemzése: míg a jelenlegi megközelítések jellemzően ritka pontfelhőre támaszkodnak, kérdés, hogy a fotogrammetriai feldolgozás során előállított sűrű pontfelhő miként használható fel a futási idő és a hardverigény csökkentésére. Emellett fontos kutatási kérdés, hogy a radiance field alapú modellek milyen hatékonysággal kezelik a kitakarásokat és a változó megvilágítási viszonyokat.
A kutatás megvalósításához megfelelő tesztadathalmaz összeállítása és rendszerezése is szükséges. Bár a vizsgált modellek alapvetően nem igényelnek klasszikus értelemben vett tanítóhalmazt, egy egységes adatkészlet megléte elengedhetetlen az objektív összehasonlításhoz és az algoritmusfejlesztéshez. További kutatási irányként vizsgálható a NeRF-alapú modellek kiterjesztése tanulható paraméterekkel, amelyek optimalizálása ezen adathalmazokon végezhető el.
Összefoglaló jelleggel alábbiakban összefoglalom a kidolgozandó feladatrészeket:

• neurális térreprezentációs módszerek áttekintése és fotogrammetriai értelmezése
• hagyományos és neurális ortofotó-előállítás összehasonlítása
• ortofotó-specifikus neurális modellek fejlesztése
• számítási igény csökkentése ortoprojekciós kényszerekkel
• inicializálási stratégiák vizsgálata (ritka/sűrű pontfelhő)
• kitakarások és megvilágítás kezelése
• tesztadatok és kiértékelési módszertan kialakítása
• minőségi és skálázhatósági elemzés
• hibrid módszerek kidolgozása

***

The aim of the research is to investigate the applicability of neural network-based scene reconstruction models—such as Gaussian splatting and Neural Radiance Fields (NeRF)—and to develop new or novel approaches based on these methods for the generation of high-accuracy orthophotos. The focus of the study is the comparison of traditional photogrammetric workflows and modern neural representations, with particular emphasis on geometric and radiometric accuracy. Furthermore, the research addresses the reduction of computational requirements by exploiting the specific properties of orthophotos and orthographic projection.
Orthophotos derived from aerial or drone imagery are essential end products in surveying and remote sensing applications, as they enable direct, distortion-free measurements. However, orthophotos generated using current methods often exhibit geometric distortions and visible seamlines. One of the main reasons for this is that these approaches typically project existing image textures onto a surface model, without the ability to generate new texture information. In contrast, neural approaches—such as Gaussian splatting and NeRF—are capable of producing spatially continuous and photorealistic representations, even in cases of incomplete image coverage, thereby implicitly interpolating missing information. Accordingly, the objective of the research is to generate orthorectified images that are both visually realistic and geometrically accurate, closely matching the quality of the original imagery.
A major limitation of the investigated models is their high computational cost and reliance on dedicated GPU hardware. This is particularly challenging in aerial and drone photogrammetry, where datasets are typically large in both resolution and number of images. Furthermore, existing approaches in the literature are primarily designed for general 3D scene reconstruction and do not explicitly consider the constraints of orthographic projection. It is hypothesized that incorporating these constraints can simplify the model structure, reduce the number of parameters, and consequently decrease computational demands. Another research direction is the analysis of different initialization strategies: while current methods typically rely on sparse point clouds, it remains an open question how dense point clouds obtained during photogrammetric processing can be utilized to reduce runtime and hardware requirements. In addition, an important research question is how effectively radiance field-based models can handle occlusions and varying illumination conditions.
The research also requires the creation and organization of suitable test datasets. Although the investigated models do not necessarily require traditional training datasets, the availability of a standardized dataset is essential for objective comparison and algorithm development. A further research direction is the extension of NeRF-based models with learnable parameters, which can be optimized using these datasets.
Main tasks:
• review of neural scene representation methods and their photogrammetric interpretation
• comparison of traditional and neural orthophoto generation approaches
• development of orthophoto-specific neural models
• reduction of computational cost using orthographic constraints
• investigation of initialization strategies (sparse vs. dense point clouds)
• handling of occlusions and varying illumination conditions
• creation of test datasets and evaluation methodology
• quality assessment and scalability analysis
• development of hybrid approaches combining classical and neural methods

A téma meghatározó irodalma: 

1. D. Haitz, M. Hermann, A. S. Roth, M. Weinmann, and M. Weinmann, “The potential of neural radiance fields and 3D Gaussian splatting for 3D reconstruction from aerial imagery,” ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. X-2-2024, pp. 97–104, 2024, doi: 10.5194/isprs-annals-X-2-2024-97-2024.

2. S. Chen, Q. Yan, Y. Qu, W. Gao, J. Yang, and F. Deng, “Ortho-NeRF: generating a true digital orthophoto map using the neural radiance field from unmanned aerial vehicle images,” Geo-Spatial Information Science, vol. 28, no. 2, pp. 741–760, 2025, doi: 10.1080/10095020.2023.2296014.

3. B. Kerbl, G. Kopanas, T. Leimkühler, and G. Drettakis, “3D Gaussian splatting for real-time radiance field rendering,” ACM Transactions on Graphics, 2023, doi: 10.1145/3592433.

4. D. Yue, X. Liu, Y. Wan, Y. Zhang, M. Zheng, W. Fan, and J. Zhong, “NeRFOrtho: orthographic projection images generation based on neural radiance fields,” International Journal of Applied Earth Observation and Geoinformation, vol. 136, p. 104378, 2025, doi: 10.1016/j.jag.2025.104378.

5. J. Yang, Z. Cai, T. Wang, T. Ye, H. Gao and H. Huang, "Ortho-3DGS: True Digital Orthophoto Generation From Unmanned Aerial Vehicle Imagery Using the Depth-Regulated 3D Gaussian Splatting," in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, vol. 18, pp. 10972-10994, 2025, doi: 10.1109/JSTARS.2025.3552105.

A téma hazai és nemzetközi folyóiratai: 

1. International Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences (ISPRS), ISSN 2194-9050
2. ISPRS International Journal of Geo-Information, (ISPRS) ISSN 2220-9964, 2025 Q1
3. Periodica Polytechnica Civil Engeering (BME), 2025 Q2
4. International Journal of Remote Sensing (Taylor & Francis), ISSN 1366-5901, 2025 Q2
5. Journal of Surveying Engineering (ASCE), ISSN 0733-9453, 2025 Q3

A témavezető utóbbi tíz évben megjelent 5 legfontosabb publikációja: 

1. O. E. Mora, J. G. Chen, P. Stoiber, Z. Koppanyi, D. Pluta, R. Josenhans, and M. Okubo, “Accuracy of stockpile estimates using low-cost sUAS photogrammetry,” International Journal of Remote Sensing, vol. 41, no. 12, pp. 1–16, Jun. 2020, doi: 10.1080/01431161.2020.1723167.

2. Z. Koppányi, D. Iwaszczuk, B. Zha, C. J. Saul, C. K. Toth, and A. Yilmaz, “Multimodal semantic segmentation: fusion of RGB and depth data in convolutional neural networks,” in Multimodal Scene Understanding, Academic Press, 2019, pp. 41–64. (könyvfejezet)

3. T. Toth and Z. Koppanyi, “Digital Photogrammetry,” in Position, Navigation, and Timing Technologies in the 21st Century, Y. T. J. Morton, F. Diggelen, J. J. Spilker, B. W. Parkinson, S. Lo, and G. Gao, Eds. Piscataway, NJ, USA: Wiley, 2020, pp. 1597–1633. (könyvfejezet)

4. Z. Koppányi, V. Navratil, H. Xu, C. K. Toth, and D. Grejner-Brzezinska, “Using adaptive motion constraints to support UWB/IMU based navigation,” Navigation: Journal of The Institute of Navigation, vol. 65, no. 2, pp. 247–261, 2018.

5. J. Gabela, G. Retscher, S. Goel, H. Perakis, A. Masiero, C. Toth, V. Gikas, A. Kealy, Z. Koppányi, W. Błaszczak-Bąk, Y. Li, and D. Grejner-Brzezinska, “Experimental evaluation of a UWB-based cooperative positioning system for pedestrians in GNSS-denied environment,” Sensors, vol. 19, no. 23, p. 5274, 2019, doi: 10.3390/s19235274.

A témavezető fenti folyóiratokban megjelent 5 közleménye: 

1. Z. Koppányi and C. K. Toth, “Estimating aircraft heading based on laser scanner derived point clouds,” ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, vol. 2, pp. 95–102, 2015.

2. W. Błaszczak-Bąk, Z. Koppányi, and C. K. Toth, “Reduction method for mobile laser scanning data,” ISPRS International Journal of Geo-Information, vol. 7, no. 7, p. 285, 2018.

3. Z. Koppányi, H. Demeter, N. Vékony, and T. Lovas, “Cellular handover zones as location estimators,” Periodica Polytechnica Civil Engineering, vol. 59, no. 4, pp. 451–457, 2015.

4. O. E. Mora, J. G. Chen, P. Stoiber, Z. Koppanyi, D. Pluta, R. Josenhans, and M. Okubo, “Accuracy of stockpile estimates using low-cost sUAS photogrammetry,” International Journal of Remote Sensing, vol. 41, no. 12, pp. 1–16, Jun. 2020, doi: 10.1080/01431161.2020.1723167.

5. C. K. Toth, G. Jozkow, Z. Koppányi, and D. Grejner-Brzezinska, “Positioning slow-moving platforms by UWB technology in GPS-challenged areas,” Journal of Surveying Engineering, vol. 143, no. 4, p. 04017011, 2017, doi: 10.1061/(ASCE)SU.1943-5428.0000226.

Státusz: 
beküldött